在 Styletrip 專案內,我們有提供行程規劃功能,能為使用者安排景點、餐飲和住宿,因此,我們必須要有景點、餐飲和住宿這三大類的資料。 然而當我們在抓地點資料的時候,不一定能明確知道一個地點是屬於哪一類,所以必須借助 Machine Learning 的 Classification 分類演算法來幫助我們做自動分類。
這邊我們使用到的訓練集合是各景點的部落格文章,演算法嘗試使用過 kNN 和 Bayes 分類演算法,跑出來的效果也有點不同。
![styletrip_engine [~-Project-JavaProject-styletrip_engine] - ...-src-com-infinitibeat-engine-datasource-PlaceClassifyEngine.java [styletrip_engine] - IntelliJ IDEA_006](https://enginebai.wordpress.com/wp-content/uploads/2018/06/styletrip_engine-project-javaproject-styletrip_engine-src-com-infinitibeat-engine-datasource-placeclassifyengine-java-styletrip_engine-intellij-idea_006.png?w=736)

「鹿谷綠園茶舍民宿」分類為住宿宿,而景點分類分數也很高,表示該地點是民宿,也是景點。

當然倚賴演算法不一定是100%準確,看下圖的結果

「珠珠小歇」是從美食網站抓來的,但是 kNN 演算法 n = 6 最鄰近的資料點卻判定為景點。
Leave a comment