前几天,SIGIR主席Charlie Clarke在从主席位置退下来的时候发表了一个 Note ,大意是说,从今年SIGIR的投稿量来看,SIGIR已经在衰退。然后有人就发出了IR作为一个领域也在衰退的现实性和可能性。
那么,这篇短文就是从积极的态度来探讨一下,IR领域的一些可能的新的发展方向,起到抛砖引玉的作用。
- 从传统的Relevance Theory到User Engagement Optimization
熟悉IR的人应该知道,传统的,诞生于上世纪60-70年代IR核心理论,Relevance Theory(如Probability Ranking Principle,Binary Independent Model以及后来的BM 25,Relevance Model等等)都基于有一个普遍的,全部用户通用的Relevance Label。这套理论催生了类似于TREC这样的数据测试系统。那么今天来看,这样的理论模型已经离现在的IR系统相去甚远。对于每一个Query,一个Document是否是Relevant的将不是一个固定的值,而是一个从用户出发的动态的概念。传统的,需要编辑来标注数据的模式应该成为历史,而转向全面优化用户喜好度的模型和数据评价体系。这个方向将会和Recommendation交融,为现在工业界已经很火热的方向Search & Discovery奠定理论基础和实践方法。 - Session or Beyond Optimization
用户和系统交互很多时候有非常复杂的目的。而达到这些目的需要多轮交互,比如订行程,比如找房子。现在的IR系统因为这个Relevance Label是基于Query-Document Pair的,因此,从根本上就没有办法来定义跨过单个页面的Relevancy,没法针对这样的Use Case进行优化。那么经常的场景就是,用户开启很多个浏览器窗口来回查找,花费很多时间。当然,这部分工作已经有很多尝试,不过大部分都是基于Classic Relevance Theory的,因此也很难优化真正的用户体验。如何真正建立起一套跨却Page或者Session或者Task的优化方案是这方面发展的重要课题。 - Conversational UI
这部分很火热,其实里面包装着NLP,QA等等旧酒。关键问题就是,如何在Messaging这个平台下做到搜索。这时,"搜索"界面需要理解上下文关系,需要去理解用户的喜好,还需要在能够做Task的时候,切换到Task-Oriented的场景下,来进行优化。
Read full article from IR已死?IR永生
No comments:
Post a Comment