现代人每天都在做消费决策,网络上的确也有很多消费心得分享,但你会不会总是发现:自己的需求是独一无二的,往往得耗费心思浏览许多消费心得才能得到符合自己需求的消费指引?
在走进一家餐厅,面对菜单上琳琅满目的菜色时,你会感到困扰,不晓得该选哪几道菜才不虚此行吗?在走进手机通讯行,你会犹疑在多种选择当中而不知所措吗?你会不会希望,能有一个先前不久才发布的网络民调,刚好是根据你所希望的消费需求,调查出大家所公认的最佳选择呢?
应该有更好的方式帮助消费者,利用网络上的消费心得分享做出选择,而文字探勘(Text Mining)技术是一个值得尝试的方向。
文字探勘技术协助解读大量信息
文字探勘技术结合了文字分析技术与数据探勘技术,目的是希望能够通过计算机的的运算能力,过滤及转化大量的文字内容,让人能够更有效率的运用。
相信大家应该都用过目前Web2.0网站上常见的卷标(Tagging)功能,通过这样的功能我们可以为文字、图片或影像定义一些我们认为是相关联的关键词;而最基本的文字探勘技术其实便像是在帮一段文字找到合适的卷标。以这段文字为例:
“iPhone上网真的很方便,朋友想去吃饭可以随时查地点。”(摘录自PTT iPhone版)
直接从文字内容看,它合适的标签可能包括:iPhone、上网、方便、吃饭、查地点,这些卷标可以通过关键词分析找出来。但如果想找出其他衍伸的标签,像是:好评、行动应用,就需要通过更复杂的文字探勘技术才能做到。
当一段文字内容能用一组字眼作为象征,我们就能通过这些字眼串连相关文字内容,或按照消费者需求对众多文字内容进行筛选。
Text Mining在Web上的可能应用
Web上的丰富文字,正好为文字探勘技术建立了一个取之不尽的实验场域。在两者适当的结合之下,其实能够提供许多创造新型态信息服务的可能性。
在文字探勘技术领域中,这种藉由分析文字中带有的正负面情绪及观感的方式被称作意见探勘(Opinion Mining)或情感分析(Sentiment Analysis)技术;这项技术目前在学术研究中还算是处于未成熟的阶段,仍有很多难题必须要克服。
例如我们都知道大家在撰写博客文章的时候,往往都会通过文字表现个人的情绪,让我们得以形容我们对于每个事物的感受,而一篇文章中很可能加夹杂了对于不同对象、事件的不同强度正负面观感,因此要如何准确的了解作者主要传达的观感是偏向正面或负面,是一件相当不容易的事,就像一篇分享某家泰式餐厅的食记中,作者可能对于不同的菜肴有不同的正负面观感;他可能会觉得“这家店的甜点很好吃,但是泰式酸辣汤却不是很够味,我本来最喜欢吃的椒麻鸡炸得好硬,让我超级失望”,集合这些意见他最后的结论是不推荐这家店(即使这家店的甜点非常好吃)。
针对这样的问题,我们可以通过对于否定词、程度词以及考虑正负面意见词出现频率等等的方式来处理。例如以前面的例子来说,我们可以判断出“超级失望”比“很好吃”的观感强度更强,因此最后统整出来的评论意见就可以正确判断为负面;而针对“不是很够味”这种情况也可以通过否定词的考虑来得出最正确的观感。
文字探勘技术的帮助,有机会将商品评论文章通过各种维度,如:产品、正负面,甚至是各种产品特征进行分类。然后可再根据消费者不同的需求,过滤出特定范围的商品评论文章供消费者参考,进而统计出热门程度、正负面倾向等网络民调指针,让消费者能够更有效率的做出购买决策。
| anyShare分享到: | |
| |

另类创新营销