近5年信息检索的研究热点与发展趋势综述* 您所在的位置:网站首页 国外热点问题及看法 近5年信息检索的研究热点与发展趋势综述*

近5年信息检索的研究热点与发展趋势综述*

2024-03-28 05:13| 来源: 网络整理| 查看: 265

1 引 言

近年来, 国内外学者对信息检索领域的研究成果相当丰富。司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]。

国外学者的研究则更倾向于对信息检索的具体应用的综述。Casey等探讨了以内容为基础的音乐信息检索目前的发展方向以及未来面临的诸多挑战[6]; Kishida对当前最先进的跨语言信息检索技术和方法进行综述[7]; Enser援引大量文献综述了数字化时代的图像检索、视频检索、语义图像检索等可视化信息检索的发展历程[8]; Smeaton等通过对 SIGIR 过去 25 届年会的主题和合著情况作分析, 概要地展示了SIGIR 25年中不同主题的分布及作者发文情况[9]; Hiemstra等对过去 30 年中 SIGIR 会议文献作分析并揭示了研究主题、作者分布及合著情况[10]。

综合来看, 国内外学者大多以相关期刊论文为对象分析信息检索的研究热点和发展趋势, 少部分研究采用会议论文进行分析, 且在这些研究中作者均选择了ACM SIGIR这一会议的论文为研究对象, 鉴于目前信息检索的发展方向十分丰富, 综合多个相关国际会议论文进行对比分析就显得更有理论价值和实践意义。

2 数据来源与研究方法

本文选取国际计算机语言学协会年会(ACL)、国际计算机学会多媒体会议(ACMMM)、国际机器学习大会(ICML)、国际计算机学会知识发现与数据挖掘年会(KDD)以及信息检索特别兴趣小组会议(SIGIR)等5个信息检索相关的国际会议2012年-2016年收录的论文为对象, 通过网络爬虫工具获取其摘要及关键词, 并利用Stanford CoreNLP进行分词处理[11], 进行研究趋势的统计和归类分析。

本文主要运用以下研究方法:

(1) 网络调查法, 通过5个国际会议的官方网站查找和获取有关的论文数据, 使得本文比较具有真实性。

(2) 文献研究法, 借助ACM DL、WoS、中国知网等数据库检索有关文献并发现其可参考之处, 使得本文更加全面和具有说服力。

(3) 统计分析法, 使用网络爬虫工具获取了2012年-2016年5个国际会议出版论文的数量及其摘要和关键词, 对热点词的词频进行统计, 从而分析信息检索领域的研究趋势, 因此本文具有较强的严谨性。

3 总体统计与分析

各年度会议论文数量的变化趋势如图1所示, 总体来看, 5个会议在2012年-2016年收录的论文数都呈上升的趋势, 信息检索的研究和应用不断丰富, 推动着相关会议接收论文数的持续增长。

显示原图| 下载原图ZIP| 生成PPT

图1   各年度会议论文数量变化趋势

   

对5个会议2012年-2016年收录论文的摘要做分词处理, 并与关键词一起在Excel中进行筛选和排序, 得到排名前20的热点词, 利用WordArt.com生成词云图, 如图2所示, 可以发现这些热点词集中在以下几个方面:

显示原图| 下载原图ZIP| 生成PPT

图2   各会议2012年-2016年热点词词云图

   

(1) 信息检索类型: 图像检索(image retrieval)、视频搜索(video search)以及音乐搜索(music search)等。

(2) 信息检索技术: 事件检测(event detection)、协同过滤(collaborative filtering)、特征选择(feature selection)和矩阵分解(matrix factorization)等。

(3) 信息检索研究情境: 社会网络(social networks)以及社交媒体(social media)。

(4) 信息检索关联技术: 自然语言处理(natural language processing)、机器学习(machine learning)、深度学习(deep learning)以及神经网络(neural networks)等。

4 研究热点分析 4.1 热点词统计排名分析

对各年度5个会议的热点词分别进行了统计和排序, 得到各年度会议论文热点词频次排名如表1所示。由此得出以下发现:

表1

表1   各年度会议论文热点词频次排名表

   

序号热点词总词频各年度热点词频次201220132014201520161神经网络394919811101752机器学习386457272871103社交网络379109815683504社交媒体35866765171665搜索引擎31573706979246信息检索19635416555397数据挖掘14843313128158图像检索12841282224119自然语言处理1266107525110主题模型112224813132611监督式学习109302022162112网页搜索101113029221013推荐系统100202523201214深度学习885511184915视频搜索88272017141016事件检测8714186282117音乐搜索86111415212418协同过滤82142219161119特征选择7527141412820矩阵分解7521221610621主动学习732621137622情感分析6816810142023语言模型6717191012924分词技术6561420131225增强学习631879623

新窗口打开

(1) 人工智能相关的热点词词频均处于上升趋势, 其中神经网络和深度学习在5年间迅速成为信息检索的重点研究内容。神经网络是人工神经网络(Artificial Neural Network)的简称, 人工神经网络是从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型, 按不同的连接方式组成不同的网络[12], 其中递归神经网络(Recurrent Neural Network, RNN)和卷积神经网络(Convolutional Neural Network, CNN)是学者们关注的焦点。RNN是一种反馈神经网络, 是一个非线性动力系统, 可用来实现联想记忆和求解优化等问题[13]; CNN是一种前馈神经网络, 它的人工神经元可以响应一部分覆盖范围内的周围单元[14], 其主要用于处理大型图像。深度学习是机器学习中一种基于数据进行表征学习的方法, 其主要优势是利用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征[15]。

(2) 相对而言, 学者们对一些信息检索技术的关注度小幅下降, 如特征选择和矩阵分解等热点词的出现频率整体上逐年减少。特征选择是从原始特征中选择出一些最有效特征以降低数据集维度的过程, 是提高学习算法性能的一个重要手段, 也是模式识别中关键的数据预处理步骤[16]; 矩阵分解的思想就是信息检索中用户和物品都会有一些特性, 矩阵分解可以从评分矩阵中分解出用户——特性矩阵, 特性——物品矩阵, 从而得到了用户的偏好和每件物品的特性以及确定矩阵的维度[17]。由此看出目前信息检索研究已经不只局限于自身相关的技术, 而是转向融合其他学科技术的综合研究。

4.2 各会议主题分析

本文对各年度会议论文的主题进行整理和分类, 归纳出各年度会议论文主题词表, 如表2所示。从中可以看出:

表2

表2   各年度会议论文主题词表

   

年度

会议 主题

20122013201420152016ACL机器翻译; 数据挖掘; 信息抽取; 问答系统; 文本分类; 自然语言处理应用观点挖掘; 机器翻译; 自然语言处理应用; 问答系统; 机器学习; 文本分类; 信息抽取;机器翻译; 自然语言处理; 分词技术与词性标注; 情感分析; 机器学习; 问答系统神经网络; 机器学习; 信息抽取; 机器翻译; 问答系统; 自然语言处理; 主题模型问答系统; 信息抽取; 神经网络; 机器翻译; 深度学习; 语义分析; 情感分析; 文本分类;ACMMM多媒体推荐; 持续性情感分析; 基于内容的图像检索; 大规模搜索; 人脸识别; 社交媒体行为与事件识别; 多峰分析; 社会动力学; 相似性搜索; 情境感知; 音乐与戏剧分析行为与事件识别; 深度学习; 人机交互; 多媒体分析与挖掘; 隐私与健康; 多媒体推荐; 移动搜索多媒体标引与搜索; 行为与事件识别; 多媒体质量感知; 人机交互; 虚拟现实与增强现实; 移动设备人脸与情感识别; 视频搜索; 深度学习; 虚拟现实与增强现实; 隐私与健康; 人机交互ICML聚类分析; 增强学习; 神经网络与深度学习; 优化算法; 隐私与保密; 监督式学习; 概率模型增强学习; 深度学习; 社交网络; 主题模型; 支持向量机与决策树; 聚类分析; 优化算法; 矩阵分解深度学习; 增强学习; 结构化预测; 聚类分析; 特征选择; 神经网络; 矩阵分解; 主题模型深度学习; 概率模型; 增强学习; 结构化预测; 时间序列分析; 特征选择; 隐私研究; 聚类分析神经网络与深度学习; 增强学习; 矩阵分解; 大数据; 监督式学习; 隐私研究; 图解模型; 聚类分析KDD网页级别与社交媒体; 模式挖掘; 概率模型; 监督式学习; 网站应用; 个性化推荐文档与主题模型; 社交媒体; 大数据框架; 图像挖掘; 医疗与生活; 深度学习; 推荐系统医疗与安全; 监督式学习; 社交媒体; 特征选择; 文本挖掘; 隐私与保密; 主题模型; 移动设备大数据; 主题模型; 隐私与保密; 移动设备; 知识发现; 医疗健康; 模式挖掘; 推荐系统; 电子商务图像与社交网络; 深度学习; 聚类分析; 推荐系统; 用户行为模型; 优化算法; 电子商务SIGIR多媒体; 检索评价; 推荐系统; 搜索日志分析; 社交媒体; 个性化与用户模型; 搜索效率; 文本分类社交媒体; 推荐系统; 主题模型; 多媒体检索; 用户行为; 文本分类; 电子商务; 相似性搜索; 移动搜索社交媒体; 移动搜索; 标引与搜索效率; 用户与模型; 情感分析; 引用推荐; 搜索满意度; 搜索风险评估; 哈希算法多媒体搜索; 搜索体验; 社交媒体; 用户模型; 分类与排名; 深度学习; 任务与设备; 电子商务; 移动搜索检索模型; 音乐与数学; 隐私、广告与产品; 行为模型与应用; 移动设备; 实体与知识图谱; 问答系统; 多媒体搜索

新窗口打开

(1) ACL会议中机器翻译、信息抽取、问答系统以及自然语言处理等研究主题较为稳定, 但其中某些同一主题下的论文的研究内容也随时间的推进而发生演变。例如对信息抽取的关注点从语义关系抽取转向命名实体识别和大规模信息抽取; 在机器翻译方面, 从基于短语的统计机器翻译研究转向端对端的神经机器翻译研究; 而对于问答系统的研究则由基于增强词汇的语义模型向分层并行的知识理解模型转变。总的来说, ACL会议主要关注信息检索中的信息的获取与处理和语义的分析与理解等内容。

(2) ACMMM会议的主题则较为丰富, 其中涉及到较多与信息检索相关的新技术。人机交互是指人与计算机之间使用某种对话语言, 以一定的交互方式, 为完成确定任务的人与计算机之间的信息交换过程[18], 有关人机交互方面的研究从行为与事件识别转向人脸识别以及情感识别。近两年, 虚拟现实与增强现实也成为ACMMM会议的热门研究主题, 虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统[19]; 增强现实技术是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术[20]。综合其他主题发现, ACMMM会议主要呈现了新兴技术与信息检索的交互应用以及多媒体信息的搜索、推荐和评价。

(3) ICML会议则较为专注于研究聚类分析以及深度学习、增强学习和监督式学习等机器学习的子类方法。聚类分析是将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程, 其研究内容包括预测药物不良反应事件[21]以及子空间分割的多任务学习[22]等。综合来看, ICML侧重于探索机器学习与信息检索的融合以及对检索模型的研究。

(4) KDD会议的主题倾向于各类数据的挖掘与知识发现, 挖掘形式从文本挖掘、图像挖掘到模式挖掘, 研究的情境从2012年-2014年的社交媒体到近两年的电子商务, 研究内容覆盖了网站应用、医疗健康、隐私与保密以及用户行为等。此外, 近5年KDD会议对推荐系统的研究也较为热门, 推荐系统是根据用户的兴趣特点和购买行为的过程, 向用户推荐用户感兴趣的信息和商品, 其推荐方法包括基于内容推荐、基于关联规则推荐、基于知识推荐和组合推荐等[23]。从以上主题中可以看出, 信息检索与数据挖掘息息相关, 两者的综合应用前景广阔。

(5) SIGIR会议的研究主题大多集中在信息检索技术以及应用, 且研究内容由搜索日志分析、文本分类以及检索模型转向搜索算法、搜索效果评价和问答系统等; 此外, SIGIR会议的主题中涉及用户研究的也比较多, 如个性化推荐、情感分析、用户行为以及搜索体验和满意度等, 总的来看, SIGIR会议各年度论文主题推陈出新, 如对于赞助商搜索广告的语义匹配研究[24]以及通过探索在线用户行为来提高个性化音乐检索效率[25], 信息检索的研究范畴正在逐渐扩大。

5 研究趋势分析

根据以上对热点词和主题词的分析以及对各年度会议论文的对比研究, 笔者归纳出信息检索研究的如下发展趋势:

5.1 移动搜索成为主流研究内容

随着互联网和智能科技的不断发展, 信息检索不再只有个人电脑终端(PC)搜索, 用户越来越多地依赖移动设备来搜索他们所需的信息以及服务。从各会议的论文中发现:

(1) 移动搜索与周边的商家及服务密不可分。基于移动搜索和PC搜索的不同, Lv等通过数据分析了用户在移动设备上的搜索日志[26]。

(2) 用户行为是目前整个学术界的研究热点, 用户移动搜索行为也在信息检索领域中有所涉及。Lagun等通过实验研究了用户在移动搜索中对移动设备视窗的注意情况[27]。

(3) 较多学者正在评估用户对移动搜索的满意度。Williams等研究了搜索答案对于移动搜索用户的影响以及用户相应的满意度[28]。

5.2 信息检索模型正在优化和拓展

信息检索模型是信息检索的主要研究内容, 其运用数学或其他语言与工具, 对于信息检索的查询和文档及其匹配程度进行抽象描述, 目前的信息检索模型包括布尔模型、向量空间模型、概率模型、语言模型以及基于本体的检索模型等[29]。各会议对于布尔模型的研究较少, 而主要关注其他模型的优化和拓展应用。从这些相关论文中可以看出:

(1) 语言模型是当前最受关注的信息检索模型, 无论是在社交网站上的应用, 还是运用到多媒体检索或特定文档的检索任务。Tsagkias等开发了推断用户浏览行为的语言动机模型[30]; Chen等则将多峰语言模型用于演讲视频检索中[31]; Raviv等研究了基于实体的语言模型在小说文档中的检索效果[32]。

(2) 概率模型则更多地用于提高检索的效率。Zhao等构建了上下文相关的邻近检索模型以提升检索的效率[33]。

5.3 更加注重过滤与推荐

在信息检索中, 过滤与推荐是满足用户信息需求的重要技术, 有关过滤与推荐的算法和系统始终是学者们关注的问题。从各会议的论文中得出以下结论:

(1) 协同过滤是利用某兴趣相投、拥有共同经验的群体的喜好来推荐用户感兴趣的信息, 其突出优点在于能够结合其他人的经验, 过滤机器难以自动内容分析的信息, 避免了内容分析的不完全或不精确[34]。Shih等提出了一种提升协同过滤中评价较少项目的方法[35]。

(2) 学者们对社交媒体内容的推荐以及相关研究颇有兴趣。Hayashi等在研究Twitter信息检索时开发了一种将主题抽取和信息流过滤融合的流算法并应用于Twitter信息流中[36]。

(3) 多媒体信息是当前信息检索领域中过滤与推荐研究关注的最热门内容。Lu等研究了基于创新计算的在线视频推荐系统[37]; Mao等以歌曲难度评级为依据开发了首个社交歌唱社区推荐系统[38]。

5.4 信息检索与人工智能关系密切

信息检索与计算机科学有着千丝万缕的联系, 而当前人工智能是计算机科学的一个热门分支, 因此信息检索与人工智能的关系相当密切。纵观各会议的论文主要有以下几个方面的发现:

(1) 机器学习应用于信息检索中的查询与鉴别。Lu等运用非监督式学习的方法系统地鉴别音乐数据集中的异常部分[39]。

(2) 神经网络在跨语言检索中的应用。Zhou等建立了一种弱共享深度神经网络结构来解决跨语言情感分类中源语言数据与目标语言数据的特征空间重叠问题[40]。

(3) 在机器学习中运用信息检索可以实现人机对话等多方面的功能。Yan等运用信息检索、自然语言处理等技术建立了人机之间的自动对话系统[41]。

5.5 隐私问题在信息检索中广受关注

伴随着信息检索技术的发展, 隐私的泄露和非法交易等问题不断出现, 因此隐私问题也是信息检索领域的众多学者热衷于研究的。从相关论文中可以得出:

(1) 信息检索广泛应用于社交媒体用户的隐私保护问题。Zerr等提出一种自动检测隐私照片的技术并开发了基于隐私意识的照片分类检索系统[42]。

(2) 差分隐私(Differential Privacy)是基于数据失真的隐私保护技术, 通过向查询或者分析结果中添加噪音使数据失真, 从而达到隐私保护的目的[43]。Zhang等介绍了一种利用差分隐私技术将查询日志匿名化的检索框架[44]。

(3) 信息检索还用于研究个性化网络搜索中的隐私问题。Ahmad等提出了建立在客户端基于主题的隐私保护措施以解决搜索引擎保存用户历史搜索记录可能产生的隐私问题[45]。

5.6 医疗与健康成为焦点

近年来, 医疗与健康问题已经成为各学科的研究热点, 在信息检索领域也不例外。通读各会议相关论文发现信息检索对医疗与健康的研究主要集中在以下方面:

(1) 医疗信息检索的质量和效果是学者们所重点关注的。Schoenherr等研究了挖掘健康信息的查询和搜索历史的潜在策略[46]。

(2) 通过信息检索可以实现对用户健康状况的监控。Sidana等运用主题模型的思想提出了一种新的潜在疾病模型[47]。

6 结 语

本文通过对5个相关会议的论文进行分析与综述, 发现了信息检索的研究现状及发展趋势, 为相关学者展现了该领域的大致发展面貌, 从而为开拓新的研究方向与主题提供了一定的借鉴意义。但由于部分会议论文的获取难度较大, 仅能采集到题目、摘要和关键词等信息, 无法从全文的视角进行更具深度的分析, 因此下一步值得开展的研究是进行基于全文内容以及引文的分析, 从而更好地了解信息检索的最新动态。

作者贡献声明:

杨超凡: 设计研究方案, 分析数据, 起草论文;

邓仲华: 提出研究思路, 论文最终版本修订;

彭鑫: 审核和清洗数据, 论文最终版本修订;

刘斌: 采集数据。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据见期刊网络版http://www.infotech.ac.cn。

[1] 杨超凡, 刘斌. conf data. zip. 近五年来信息检索的研究现状与发展趋势综述关联数据.

参考文献 原文顺序 文献年度倒序 文中引用次数倒序 被引期刊影响因子 [1] 司莉, 庄晓喆, 贾欢.

近10年来国外多语言信息组织与检索研究进展与启示

[J]. 中国图书馆学报, 2015, 41(4): 112-126.

https://doi.org/10.13530/j.cnki.jlis.150022      URL      [本文引用: 1]      摘要

近年来国外在多语言信息组织与检索研究领域取得了显著进展。本文以Wo S、ACM、Emerald、Elsevier、Pro Quest、Springer等数据库收录的文献为基础,对近10年来该领域的研究进行述评。国外研究重点关注以下问题:多语言本体构建与协调,基于关联数据的多语言语义网建设,跨语种语言资源和知识组织系统互操作,多语言文本分类与聚类,多语言环境下的用户信息行为,多语言信息检索模型,多语言信息检索方法与技术,多语言信息检索系统开发及评估,特定领域的多语言信息检索,交互式多语言信息检索。对我国的启示主要体现在:加强实证研究方法的应用,开发面向实用的多语言信息检索系统,注重基于语义的信息组织与检索研究,拓展特定学科领域应用研究。

(Si Li, Zhuang Xiaozhe, Jia Huan.

A Review of Multilingual Information Organization and Retrieval Research Abroad in the Last Ten Years

[J]. Journal of the Library Science in China, 2015, 41(4): 112-126.)

https://doi.org/10.13530/j.cnki.jlis.150022      URL      [本文引用: 1]      摘要

近年来国外在多语言信息组织与检索研究领域取得了显著进展。本文以Wo S、ACM、Emerald、Elsevier、Pro Quest、Springer等数据库收录的文献为基础,对近10年来该领域的研究进行述评。国外研究重点关注以下问题:多语言本体构建与协调,基于关联数据的多语言语义网建设,跨语种语言资源和知识组织系统互操作,多语言文本分类与聚类,多语言环境下的用户信息行为,多语言信息检索模型,多语言信息检索方法与技术,多语言信息检索系统开发及评估,特定领域的多语言信息检索,交互式多语言信息检索。对我国的启示主要体现在:加强实证研究方法的应用,开发面向实用的多语言信息检索系统,注重基于语义的信息组织与检索研究,拓展特定学科领域应用研究。 [2] 吴丹, 邱瑾.

国外协同信息检索行为研究述评

[J]. 中国图书馆学报, 2012, 38(6): 100-110.

https://doi.org/10.3969/j.issn.1001-8867.2012.06.011      URL      Magsci      [本文引用: 1]      摘要

本文以国外期刊发表的协同信息检索行为研究文献为对象,采用综合归纳方法,分析协同信息检索行为研究的要进展。研究发现:协同信息检索行为研究主要从理论研究走向应用实践研究;其研究主题呈现一定规律性;研究方法主要采用定量和定性相结合的方法。但协同信息检索行为研究还存在一些问题,其未来发展趋势包括:开展跨学科研究和学科间的合作;通过用户模型形式化地揭示从个人信息检索到协同信息检索的诱发因素; 探究影响用户协同信息检索的原因;开发协同检索技术与协同检索系统等。参考文献63。

(Wu Dan, Qiu Jin.

A Review on Foreign Studies of Collaborative Information Seeking Behavior

[J]. Journal of the Library Science in China, 2012, 38(6): 100-110.)

https://doi.org/10.3969/j.issn.1001-8867.2012.06.011      URL      Magsci      [本文引用: 1]      摘要

本文以国外期刊发表的协同信息检索行为研究文献为对象,采用综合归纳方法,分析协同信息检索行为研究的要进展。研究发现:协同信息检索行为研究主要从理论研究走向应用实践研究;其研究主题呈现一定规律性;研究方法主要采用定量和定性相结合的方法。但协同信息检索行为研究还存在一些问题,其未来发展趋势包括:开展跨学科研究和学科间的合作;通过用户模型形式化地揭示从个人信息检索到协同信息检索的诱发因素; 探究影响用户协同信息检索的原因;开发协同检索技术与协同检索系统等。参考文献63。 [3] 杨海锋.

用户行为在信息检索中的研究现状及发展动态评述

[J]. 图书情报知识, 2015(6): 79-88.

https://doi.org/10.13366/j.dik.2015.06.079      URL      [本文引用: 1]      摘要

用户搜索行为已受到了学者们的广泛研究,并涌现出了许多优秀的研究成果!,本文跟踪国内外重要研究成果,对其研究现状进行了总结和评述,并提出了面临的诸多挑战。研究主要涉及到不同类型的用户、检索行为的类别、主要研究方法、实际应用几个方面。研究结果表明,搜索用户的行为研究更加隐式化和细分化,研究数据收集更加多样科学化,研究方法和模型更加丰富化,实际应用更加广泛化。用户搜索行为中包含着非常重要的隐式信息,借助科学的数据收集和分析方法对其进行充分挖掘和应用将不断改进检索系统的服务能力,提高用户的检索满意度。但由于用户检索行为的随机性、隐含性等特点,目前对检索用户行为的研究还存在许多不足之处,比如研究针对特定实验环境开展而通用性和外效性不强,因为其无法确保抽样数据的充分性和多样性等。

(Yang Haifeng.

Review on the Research Status and Development Trend of Users Behavior in Information Retrieval

[J]. Document, Information & Knowledge, 2015(6): 79-88.)

https://doi.org/10.13366/j.dik.2015.06.079      URL      [本文引用: 1]      摘要

用户搜索行为已受到了学者们的广泛研究,并涌现出了许多优秀的研究成果!,本文跟踪国内外重要研究成果,对其研究现状进行了总结和评述,并提出了面临的诸多挑战。研究主要涉及到不同类型的用户、检索行为的类别、主要研究方法、实际应用几个方面。研究结果表明,搜索用户的行为研究更加隐式化和细分化,研究数据收集更加多样科学化,研究方法和模型更加丰富化,实际应用更加广泛化。用户搜索行为中包含着非常重要的隐式信息,借助科学的数据收集和分析方法对其进行充分挖掘和应用将不断改进检索系统的服务能力,提高用户的检索满意度。但由于用户检索行为的随机性、隐含性等特点,目前对检索用户行为的研究还存在许多不足之处,比如研究针对特定实验环境开展而通用性和外效性不强,因为其无法确保抽样数据的充分性和多样性等。 [4] 窦永香, 苏山佳, 赵捧未.

信息检索研究的发展与动向——对 ACM SIGIR信息检索年会的主题分析

[J]. 情报理论与实践, 2010, 33(7): 124-128.

URL      [本文引用: 1]      摘要

通过对信息检索领域顶级的国际会议——美国计算机协会信息检索专业组织举办的32届信息检索 年会共354个主题收集、整理并分类,从理论、技术和应用3个方面归纳信息检索研究的发展概况。借助主题分析,总结信息检索领域的主要研究内容、研究热点 及最新研究动向并对信息检索的发展趋势进行展望。

(Dou Yongxiang, Su Shanjia, Zhao Pengwei.

Progress and Development Trend in the Study of Information Retrieval

[J]. Information Studies: Theory & Application, 2010, 33(7): 124-128.)

URL      [本文引用: 1]      摘要

通过对信息检索领域顶级的国际会议——美国计算机协会信息检索专业组织举办的32届信息检索 年会共354个主题收集、整理并分类,从理论、技术和应用3个方面归纳信息检索研究的发展概况。借助主题分析,总结信息检索领域的主要研究内容、研究热点 及最新研究动向并对信息检索的发展趋势进行展望。 [5] 陈少涌, 李广建.

近十年来信息检索研究发展动向——基于SIGIR年会主题及论文集的统计分析

[J]. 情报科学, 2015, 33(5): 150-156.

[本文引用: 1]     

(Chen Shaoyong, Li Guangjian.

Research on Information Retrieval over the Last Decade: Analysis of SIGIR Annual Conferences’ Research Topics and Proceedings

[J]. Information Science, 2015, 33(5): 150-156.)

[本文引用: 1]     

[6] Casey M A, Veltkamp R, Goto M, et al.

Content-Based Music Information Retrieval: Current Directions and Future Challenges

[J]. Proceedings of the IEEE, 2008, 96(4): 668-696.

https://doi.org/10.1109/JPROC.2008.916370      URL      [本文引用: 1]      摘要

The steep rise in music downloading over CD sales has created a major shift in the music industry away from physical media formats and towards online products and services. Music is one of the most popular types of online information and there are now hundreds of music streaming and download services operating on the World-Wide Web. Some of the music collections available are approaching the scale of ten million tracks and this has posed a major challenge for searching, retrieving, and organizing music content. Research efforts in music information retrieval have involved experts from music perception, cognition, musicology, engineering, and computer science engaged in truly interdisciplinary activity that has resulted in many proposed algorithmic and methodological solutions to music search using content-based methods. This paper outlines the problems of content-based music information retrieval and explores the state-of-the-art methods using audio cues (e.g., query by humming, audio fingerprinting, content-based music retrieval) and other cues (e.g., music notation and symbolic representation), and identifies some of the major challenges for the coming years. [7] Kishida K.

Technical Issues of Cross-language Information Retrieval: A Review

[J]. Information Processing and Management, 2005, 41(3): 433-455.

https://doi.org/10.1016/j.ipm.2004.06.007      URL      [本文引用: 1]      摘要

This paper reviews state-of-the-art techniques and methods for enhancing effectiveness of cross-language information retrieval (CLIR). The following research issues are covered: (1) matching strategies and translation techniques, (2) methods for solving the problem of translation ambiguity, (3) formal models for CLIR such as application of the language model, (4) the pivot language approach, (5) methods for searching multilingual document collection, (6) techniques for combining multiple language resources, etc. [8] Enser P.

The Evolution of Visual Information Retrieval

[J]. Journal of Information Science, 2008, 34(4): 531-546.

https://doi.org/10.1177/0165551508091013      URL      [本文引用: 1]      摘要

This paper seeks to provide a brief overview of those developments which have taken the theory and practice of image and video retrieval into the digital age. Drawing on a voluminous literature, the context in which visual information retrieval takes place is followed by a consideration of the conceptual and practical challenges posed by the representation and recovery of visual material on the basis of its semantic content. An historical account of research endeavours in content-based retrieval, directed towards the automation of these operations in digital image scenarios, provides the main thrust of the paper. Finally, a look forwards locates visual information retrieval research within the wider context of content-based multimedia retrieval. [9] Smeaton A F, Keogh G, Gurrin C, et al.

Analysis of Papers from Twenty-Five Years of SIGIR Conferences: What Have We been Doing for the Last Quarter of a Century?

[J]. ACM SIGIR Forum, 2002, 36(2): 39-43.

https://doi.org/10.1145/792550      URL      [本文引用: 1]     

[10] Hiemstra D, Hauff C, Jong F.

SIGIR’s 30th Anniversary: An Analysis of Trends in IR Research and the Topology of Its Community

[J]. ACM SIGIR Forum, 2007, 41(2): 18-24.

https://doi.org/10.1145/1328964.1328966      URL      [本文引用: 1]      摘要

This paper presents an analysis of all SIGIR proceedings to date in order to summarize what IR researchers discussed over the years, where they are from, and whether subcommunities can be identified, determined by co-authorship. [11] Christopher D, Surdeanu M, Bauer J, et al.

The Stanford CoreNLP Natural Language Processing Toolkit

[C]// Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations.2014.

[本文引用: 1]     

[12] Park D C, El-Sharkawi M A, Marks R J, et al.

Electric Load Forecasting Using an Artificial Neural Network

[J]. IEEE Transactions on Power Engineering, 1991, 6(2): 442-449.

[本文引用: 1]     

[13] Pineda F J.

Generalization of Back-Propagation to Recurrent Neural Networks

[J]. Physical Review Letters, 1987, 59(19): 2229-2232.

https://doi.org/10.1103/PhysRevLett.59.2229      URL      PMID: 10035458      [本文引用: 1]      摘要

An adaptive neural network with asymmetric connections is introduced. This network is related to the Hopfield network with graded neurons and uses a recurrent generalization of the \ensuremath{\delta} rule of Rumelhart, Hinton, and Williams to modify adaptively the synaptic weights. The new network bears a resemblance to the master/slave network of Lapedes and Farber but it is architecturally simpler. [14] Krizhevsky A, Sutskever, B, Hinton G E.

ImageNet Classification with Deep Convolutional Neural Networks

[C]// Proceedings of the 2012 Advances in Neural Information Processing Systems.2012.

[本文引用: 1]     

[15] Yann L, Bengio Y, Hinton G.

Deep Learning

[J]. Nature, 2015, 521: 436-444.

https://doi.org/10.1038/nature14539      URL      [本文引用: 1]     

[16] Guyon I, Elisseeff A.

An Introduction to Variable and Feature Selection

[J]. Journal of Machine Learning Research, 2003, 3(6): 1157-1182.

[本文引用: 1]     

[17] Koren Y, Bell R, Volinsky C.

Matrix Factorization Techniques for Recommender Systems

[J]. IEEE Computer Society, 2009, 42(8): 30-37.

https://doi.org/10.1109/MC.2009.263      URL      [本文引用: 1]      摘要

As the Netflix Prize competition has demonstrated, matrix factorization models are superior to classic nearest neighbor techniques for producing product recommendations, allowing the incorporation of additional information such as implicit feedback, temporal effects, and confidence levels. [18] 董士海.

人机交互的进展及面临的挑战

[J]. 计算机辅助设计与图形学学报, 2004, 16(1): 1-12.

https://doi.org/10.3321/j.issn:1003-9775.2004.01.001      URL      [本文引用: 1]      摘要

叙述了人机交互的最近进展,尤其是我国的一些优秀成果,包括多通道交互、交互模型、虚拟现实和三维交互、可穿戴计算和移动计算、智能空间、标准化;并论述了无所不在计算等对人机交互提出的挑战.最后发表了若干看法.

(Dong Shihai.

Progress and Challenge of Human-Computer Interaction

[J]. Journal of Computer-Aided Design & Computer Graphics, 2004, 16(1): 1-12.)

https://doi.org/10.3321/j.issn:1003-9775.2004.01.001      URL      [本文引用: 1]      摘要

叙述了人机交互的最近进展,尤其是我国的一些优秀成果,包括多通道交互、交互模型、虚拟现实和三维交互、可穿戴计算和移动计算、智能空间、标准化;并论述了无所不在计算等对人机交互提出的挑战.最后发表了若干看法. [19] Steuer J.

Defining Virtual Reality: Dimensions Determining Telepresence

[J]. Journal of Communication, 1992, 42(4): 73-93.

https://doi.org/10.1111/j.1460-2466.1992.tb00812.x      URL      [本文引用: 1]      摘要

First page of article [20] Azuma R T.

A Survey of Augmented Reality

[J]. Teleoperators and Virtual Environments, 1997, 6(4): 355-385.

https://doi.org/10.1162/pres.1997.6.4.355      URL      [本文引用: 1]      摘要

This paper surveys the field of Augmented Reality, in which 3-D virtual objects are integrated into a 3-D real environment in real time. It describes the medical, manufacturing, visualization, path planning, entertainment and military applications that have been explored. This paper describes the characteristics of Augmented Reality systems, including a detailed discussion of the tradeoffs between optical and video blending approaches. Registration and sensing errors are two of the biggest problems in building effective Augmented Reality systems, so this paper summarizes current efforts to overcome these problems. Future directions and areas requiring further research are discussed. This survey provides a starting point for anyone interested in researching or using Augmented Reality. 1. Introduction 1.1 Goals This paper surveys the current state-of-the-art in Augmented Reality. It describes work performed at many different sites and explains the issues and problems encountered when ... [21] Davis J, Costa V S, Peissig P, et al.

Demand-Driven Clustering in Relational Domains for Predicting Adverse Drug Events

[C]//Proceedings of the 29th International Conference on Machine Learning, Edinburgh, Scotland, UK. 2012.

[本文引用: 1]     

[22] Wang Y, Wipf D, Ling Q, et al.

Multi-Task Learning for Subspace Segmentation

[C]//Proceedings of the 32nd International Conference on Machine Learning, Lille, France. 2015.

[本文引用: 1]     

[23] 任磊.

推荐系统关键技术研究

[D]. 上海: 华东师范大学, 2012.

[本文引用: 1]     

(Ren Lei.

Research on Some Key Issues of Recommender Systems

[D]. Shanghai: East China Normal University, 2012.)

[本文引用: 1]     

[24] Grbovic M, Djuric N, Radosavljevic V, et al.

Scalable Semantic Matching of Queries to Ads in Sponsored Search Advertising

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval.2016: 375-384.

[本文引用: 1]     

[25] Cheng Z, Shen J, Hoi S.

On Effective Personalized Music Retrieval by Exploring Online User Behaviors

[C]// Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2016: 125-134.

[本文引用: 1]     

[26] Lv Y, Lymberopoulos D, Wu Q.

An Exploration of Ranking Heuristics in Mobile Local Search

[C]//Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2012: 295-304.

[本文引用: 1]     

[27] Lagun D, Hsieh C H, Webster D, et al.

Towards Better Measurement of Attention and Satisfaction in Mobile Search

[C]//Proceedings of the 37th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2014: 113-122.

[本文引用: 1]     

[28] Williams K, Kiseleva J, Crook A C, et al.

Is This Your Final Answer? Evaluating the Effect of Answers on Good Abandonment in Mobile Search

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval.2016: 889-892.

[本文引用: 1]     

[29] 孙坦, 周静怡.

近几年来国外信息检索模型研究进展

[J]. 图书馆建设, 2008(3): 82-85.

URL      [本文引用: 1]      摘要

信息检索模型是信息检索的核心。近几年来国外对于布尔模型的研究主要表现在对布尔模型的改进及对扩展布尔模型的进一步优化。对向量空间模型的研究,主要集中在对向量空间模型的扩展研究及对向量空间模型的应用方面。概率模型的发展主要集中在继续对概率模型进一步的研究,其与其它信息检索模型的结合,以及语言模型的研究和发展。近年来对于新兴的基于本体的信息检索模型的研究,主要集中在对基于本体的信息检索模型理论的研究,与其它检索模型的融合,以及基于本体检索模型的应用。国外信息检索模型研究的最新成果,为国内此方面的研究提供了前沿性的参考信息。

(Sun Tan, Zhou Jingyi.

The Review of Information Retrieval Models in Recent Years

[J]. Library Development, 2008 (3): 82-85.)

URL      [本文引用: 1]      摘要

信息检索模型是信息检索的核心。近几年来国外对于布尔模型的研究主要表现在对布尔模型的改进及对扩展布尔模型的进一步优化。对向量空间模型的研究,主要集中在对向量空间模型的扩展研究及对向量空间模型的应用方面。概率模型的发展主要集中在继续对概率模型进一步的研究,其与其它信息检索模型的结合,以及语言模型的研究和发展。近年来对于新兴的基于本体的信息检索模型的研究,主要集中在对基于本体的信息检索模型理论的研究,与其它检索模型的融合,以及基于本体检索模型的应用。国外信息检索模型研究的最新成果,为国内此方面的研究提供了前沿性的参考信息。 [30] Tsagkias M, Blanco R.

Language Intent Models for Inferring User Browsing Behavior

[C]//Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval.2012: 335-344.

[本文引用: 1]     

[31] Chen H, Cooper M, Joshi D, et al.

Multi-modal Language Models for Lecture Video Retrieval

[C]//Proceedings of the 22nd ACM International Conference on Multimedia.2014: 1081-1084.

[本文引用: 1]     

[32] Raviv H, Kurland O, Carmel D.

Document Retrieval Using Entity-Based Language Models

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research & Development in Information Retrieval.2016: 65-74.

[本文引用: 1]     

[33] Zhao J, Huang J.

An Enhanced Context-Sensitive Proximity Model for Probabilistic Information Retrieval

[C]// Proceedings of the 37th International ACM SIGIR Conference on Research & Development in Information Retrieval. 2014: 1131-1134.

[本文引用: 1]     

[34] Goldberg D, Nichols D, Oki B M, et al.

Using Collaborative Filtering to Weave an Information Tapestry

[J]. Communications of the ACM, 1992, 35(12): 61-70.

[本文引用: 1]     

[35] Shih T Y, Hou T C, Jiang J D, et al.

Dynamically Integrating Item Exposure with Rating Prediction in Collaborative Filtering

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval.2016: 813-816.

[本文引用: 1]     

[36] Hayashi K, Maehara T, Toyoda M, et al.

Real-Time Top-R Topic Detection on Twitter with Topic Hijack Filtering

[C]// Proceedings of the 21st ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2015: 417-426.

[本文引用: 1]     

[37] Lu W, Chung F.

Computational Creativity Based Video Recommendation

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2016: 793-796.

[本文引用: 1]     

[38] Mao K, Fan J, Shou L, et al.

Song Recommendation for Social Singing Community

[C]//Proceedings of the 22nd ACM International Conference on Multimedia. 2014: 127-136.

[本文引用: 1]     

[39] Lu Y C, Wu C W, Lu C W, et al.

An Unsupervised Approach to Anomaly Detection in Music Datasets

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval.2016: 749-752.

[本文引用: 1]     

[40] Zhou G, Zeng Z, Huang J, et al.

Transfer Learning for Cross-Lingual Sentiment Classification with Weakly Shared Deep Neural Networks

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval.2016: 245-254.

[本文引用: 1]     

[41] Yan R, Song Y, Wu H.

Learning to Respond with Deep Neural Networks for Retrieval-Based Human-Computer Conversation System

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval.2016: 55-64.

[本文引用: 1]     

[42] Zerr S, Siersdorfer S, Hare J, et al.

Privacy-Aware Image Classification and Search

[C]//Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval.2012: 35-44.

[本文引用: 1]     

[43] Dwork C, McSherry F, Nissim K, et al.

Calibrating Noise to Sensitivity in Private Data Analysis

[C]//Proceedings of the 3rd Theory of Cryptography Conference. 2006: 265-284.

[本文引用: 1]     

[44] Zhang S, Yang H, Singh L.

Anonymizing Query Logs by Differential Privacy

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2016: 753-756.

[本文引用: 1]     

[45] Ahmad W U, Wang H.

Topic Model Based Privacy Protection in Personalized Web Search

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2016: 1025-1028.

[本文引用: 1]     

[46] Schoenherr G P, White R W.

Interactions Between Health Searchers and Search Engines

[C]//Proceedings of the 37th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2014: 143-152.

[本文引用: 1]     

[47] Sidana S, Mishra S, Amer-Yahia S, et al.

Health Monitoring on Social Media over Time

[C]//Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2016: 849-855.

[本文引用: 1]     

近10年来国外多语言信息组织与检索研究进展与启示 1 2015 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 近10年来国外多语言信息组织与检索研究进展与启示 1 2015 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 国外协同信息检索行为研究述评 1 2012 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 国外协同信息检索行为研究述评 1 2012 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 用户行为在信息检索中的研究现状及发展动态评述 1 2015 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 用户行为在信息检索中的研究现状及发展动态评述 1 2015 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 信息检索研究的发展与动向——对 ACM SIGIR信息检索年会的主题分析 1 2010 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 信息检索研究的发展与动向——对 ACM SIGIR信息检索年会的主题分析 1 2010 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 近十年来信息检索研究发展动向——基于SIGIR年会主题及论文集的统计分析 1 2015 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... 近十年来信息检索研究发展动向——基于SIGIR年会主题及论文集的统计分析 1 2015 ... 近年来, 国内外学者对信息检索领域的研究成果相当丰富.司莉等以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础, 对近 10 年来多语言信息组织与检索的研究进行述评[1]; 吴丹等以国外期刊发表的协同信息检索行为研究文献为对象, 采用综合归纳方法, 分析协同信息检索行为研究的进展[2]; 杨海锋跟踪国内外重要研究成果, 对用户行为在信息检索中的研究现状进行了概况和评述, 并总结了信息检索面临的诸多挑战[3]; 窦永香等对ACM SIGIR年会进行主题分析, 总结信息检索的主要研究内容、研究热点及最新研究动向[4]; 陈少涌等采用文献计量和社会网络分析等方法对近10年来ACM SIGIR年会的主题及论文进行统计分析, 揭示了信息检索领域在过去10年的文献主题分布、作者分布情况[5]. ... Content-Based Music Information Retrieval: Current Directions and Future Challenges 1 2008 ... 国外学者的研究则更倾向于对信息检索的具体应用的综述.Casey等探讨了以内容为基础的音乐信息检索目前的发展方向以及未来面临的诸多挑战[6]; Kishida对当前最先进的跨语言信息检索技术和方法进行综述[7]; Enser援引大量文献综述了数字化时代的图像检索、视频检索、语义图像检索等可视化信息检索的发展历程[8]; Smeaton等通过对 SIGIR 过去 25 届年会的主题和合著情况作分析, 概要地展示了SIGIR 25年中不同主题的分布及作者发文情况[9]; Hiemstra等对过去 30 年中 SIGIR 会议文献作分析并揭示了研究主题、作者分布及合著情况[10]. ... Technical Issues of Cross-language Information Retrieval: A Review 1 2005 ... 国外学者的研究则更倾向于对信息检索的具体应用的综述.Casey等探讨了以内容为基础的音乐信息检索目前的发展方向以及未来面临的诸多挑战[6]; Kishida对当前最先进的跨语言信息检索技术和方法进行综述[7]; Enser援引大量文献综述了数字化时代的图像检索、视频检索、语义图像检索等可视化信息检索的发展历程[8]; Smeaton等通过对 SIGIR 过去 25 届年会的主题和合著情况作分析, 概要地展示了SIGIR 25年中不同主题的分布及作者发文情况[9]; Hiemstra等对过去 30 年中 SIGIR 会议文献作分析并揭示了研究主题、作者分布及合著情况[10]. ... The Evolution of Visual Information Retrieval 1 2008 ... 国外学者的研究则更倾向于对信息检索的具体应用的综述.Casey等探讨了以内容为基础的音乐信息检索目前的发展方向以及未来面临的诸多挑战[6]; Kishida对当前最先进的跨语言信息检索技术和方法进行综述[7]; Enser援引大量文献综述了数字化时代的图像检索、视频检索、语义图像检索等可视化信息检索的发展历程[8]; Smeaton等通过对 SIGIR 过去 25 届年会的主题和合著情况作分析, 概要地展示了SIGIR 25年中不同主题的分布及作者发文情况[9]; Hiemstra等对过去 30 年中 SIGIR 会议文献作分析并揭示了研究主题、作者分布及合著情况[10]. ... Analysis of Papers from Twenty-Five Years of SIGIR Conferences: What Have We been Doing for the Last Quarter of a Century? 1 2002 ... 国外学者的研究则更倾向于对信息检索的具体应用的综述.Casey等探讨了以内容为基础的音乐信息检索目前的发展方向以及未来面临的诸多挑战[6]; Kishida对当前最先进的跨语言信息检索技术和方法进行综述[7]; Enser援引大量文献综述了数字化时代的图像检索、视频检索、语义图像检索等可视化信息检索的发展历程[8]; Smeaton等通过对 SIGIR 过去 25 届年会的主题和合著情况作分析, 概要地展示了SIGIR 25年中不同主题的分布及作者发文情况[9]; Hiemstra等对过去 30 年中 SIGIR 会议文献作分析并揭示了研究主题、作者分布及合著情况[10]. ... SIGIR’s 30th Anniversary: An Analysis of Trends in IR Research and the Topology of Its Community 1 2007 ... 国外学者的研究则更倾向于对信息检索的具体应用的综述.Casey等探讨了以内容为基础的音乐信息检索目前的发展方向以及未来面临的诸多挑战[6]; Kishida对当前最先进的跨语言信息检索技术和方法进行综述[7]; Enser援引大量文献综述了数字化时代的图像检索、视频检索、语义图像检索等可视化信息检索的发展历程[8]; Smeaton等通过对 SIGIR 过去 25 届年会的主题和合著情况作分析, 概要地展示了SIGIR 25年中不同主题的分布及作者发文情况[9]; Hiemstra等对过去 30 年中 SIGIR 会议文献作分析并揭示了研究主题、作者分布及合著情况[10]. ... The Stanford CoreNLP Natural Language Processing Toolkit 1 2014 ... 本文选取国际计算机语言学协会年会(ACL)、国际计算机学会多媒体会议(ACMMM)、国际机器学习大会(ICML)、国际计算机学会知识发现与数据挖掘年会(KDD)以及信息检索特别兴趣小组会议(SIGIR)等5个信息检索相关的国际会议2012年-2016年收录的论文为对象, 通过网络爬虫工具获取其摘要及关键词, 并利用Stanford CoreNLP进行分词处理[11], 进行研究趋势的统计和归类分析. ... Electric Load Forecasting Using an Artificial Neural Network 1 1991 ... (1) 人工智能相关的热点词词频均处于上升趋势, 其中神经网络和深度学习在5年间迅速成为信息检索的重点研究内容.神经网络是人工神经网络(Artificial Neural Network)的简称, 人工神经网络是从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型, 按不同的连接方式组成不同的网络[12], 其中递归神经网络(Recurrent Neural Network, RNN)和卷积神经网络(Convolutional Neural Network, CNN)是学者们关注的焦点.RNN是一种反馈神经网络, 是一个非线性动力系统, 可用来实现联想记忆和求解优化等问题[13]; CNN是一种前馈神经网络, 它的人工神经元可以响应一部分覆盖范围内的周围单元[14], 其主要用于处理大型图像.深度学习是机器学习中一种基于数据进行表征学习的方法, 其主要优势是利用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征[15]. ... Generalization of Back-Propagation to Recurrent Neural Networks 1 1987 ... (1) 人工智能相关的热点词词频均处于上升趋势, 其中神经网络和深度学习在5年间迅速成为信息检索的重点研究内容.神经网络是人工神经网络(Artificial Neural Network)的简称, 人工神经网络是从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型, 按不同的连接方式组成不同的网络[12], 其中递归神经网络(Recurrent Neural Network, RNN)和卷积神经网络(Convolutional Neural Network, CNN)是学者们关注的焦点.RNN是一种反馈神经网络, 是一个非线性动力系统, 可用来实现联想记忆和求解优化等问题[13]; CNN是一种前馈神经网络, 它的人工神经元可以响应一部分覆盖范围内的周围单元[14], 其主要用于处理大型图像.深度学习是机器学习中一种基于数据进行表征学习的方法, 其主要优势是利用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征[15]. ... ImageNet Classification with Deep Convolutional Neural Networks 1 2012 ... (1) 人工智能相关的热点词词频均处于上升趋势, 其中神经网络和深度学习在5年间迅速成为信息检索的重点研究内容.神经网络是人工神经网络(Artificial Neural Network)的简称, 人工神经网络是从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型, 按不同的连接方式组成不同的网络[12], 其中递归神经网络(Recurrent Neural Network, RNN)和卷积神经网络(Convolutional Neural Network, CNN)是学者们关注的焦点.RNN是一种反馈神经网络, 是一个非线性动力系统, 可用来实现联想记忆和求解优化等问题[13]; CNN是一种前馈神经网络, 它的人工神经元可以响应一部分覆盖范围内的周围单元[14], 其主要用于处理大型图像.深度学习是机器学习中一种基于数据进行表征学习的方法, 其主要优势是利用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征[15]. ... Deep Learning 1 2015 ... (1) 人工智能相关的热点词词频均处于上升趋势, 其中神经网络和深度学习在5年间迅速成为信息检索的重点研究内容.神经网络是人工神经网络(Artificial Neural Network)的简称, 人工神经网络是从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型, 按不同的连接方式组成不同的网络[12], 其中递归神经网络(Recurrent Neural Network, RNN)和卷积神经网络(Convolutional Neural Network, CNN)是学者们关注的焦点.RNN是一种反馈神经网络, 是一个非线性动力系统, 可用来实现联想记忆和求解优化等问题[13]; CNN是一种前馈神经网络, 它的人工神经元可以响应一部分覆盖范围内的周围单元[14], 其主要用于处理大型图像.深度学习是机器学习中一种基于数据进行表征学习的方法, 其主要优势是利用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征[15]. ... An Introduction to Variable and Feature Selection 1 2003 ... (2) 相对而言, 学者们对一些信息检索技术的关注度小幅下降, 如特征选择和矩阵分解等热点词的出现频率整体上逐年减少.特征选择是从原始特征中选择出一些最有效特征以降低数据集维度的过程, 是提高学习算法性能的一个重要手段, 也是模式识别中关键的数据预处理步骤[16]; 矩阵分解的思想就是信息检索中用户和物品都会有一些特性, 矩阵分解可以从评分矩阵中分解出用户——特性矩阵, 特性——物品矩阵, 从而得到了用户的偏好和每件物品的特性以及确定矩阵的维度[17].由此看出目前信息检索研究已经不只局限于自身相关的技术, 而是转向融合其他学科技术的综合研究. ... Matrix Factorization Techniques for Recommender Systems 1 2009 ... (2) 相对而言, 学者们对一些信息检索技术的关注度小幅下降, 如特征选择和矩阵分解等热点词的出现频率整体上逐年减少.特征选择是从原始特征中选择出一些最有效特征以降低数据集维度的过程, 是提高学习算法性能的一个重要手段, 也是模式识别中关键的数据预处理步骤[16]; 矩阵分解的思想就是信息检索中用户和物品都会有一些特性, 矩阵分解可以从评分矩阵中分解出用户——特性矩阵, 特性——物品矩阵, 从而得到了用户的偏好和每件物品的特性以及确定矩阵的维度[17].由此看出目前信息检索研究已经不只局限于自身相关的技术, 而是转向融合其他学科技术的综合研究. ... 人机交互的进展及面临的挑战 1 2004 ... (2) ACMMM会议的主题则较为丰富, 其中涉及到较多与信息检索相关的新技术.人机交互是指人与计算机之间使用某种对话语言, 以一定的交互方式, 为完成确定任务的人与计算机之间的信息交换过程[18], 有关人机交互方面的研究从行为与事件识别转向人脸识别以及情感识别.近两年, 虚拟现实与增强现实也成为ACMMM会议的热门研究主题, 虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统[19]; 增强现实技术是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术[20].综合其他主题发现, ACMMM会议主要呈现了新兴技术与信息检索的交互应用以及多媒体信息的搜索、推荐和评价. ... 人机交互的进展及面临的挑战 1 2004 ... (2) ACMMM会议的主题则较为丰富, 其中涉及到较多与信息检索相关的新技术.人机交互是指人与计算机之间使用某种对话语言, 以一定的交互方式, 为完成确定任务的人与计算机之间的信息交换过程[18], 有关人机交互方面的研究从行为与事件识别转向人脸识别以及情感识别.近两年, 虚拟现实与增强现实也成为ACMMM会议的热门研究主题, 虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统[19]; 增强现实技术是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术[20].综合其他主题发现, ACMMM会议主要呈现了新兴技术与信息检索的交互应用以及多媒体信息的搜索、推荐和评价. ... Defining Virtual Reality: Dimensions Determining Telepresence 1 1992 ... (2) ACMMM会议的主题则较为丰富, 其中涉及到较多与信息检索相关的新技术.人机交互是指人与计算机之间使用某种对话语言, 以一定的交互方式, 为完成确定任务的人与计算机之间的信息交换过程[18], 有关人机交互方面的研究从行为与事件识别转向人脸识别以及情感识别.近两年, 虚拟现实与增强现实也成为ACMMM会议的热门研究主题, 虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统[19]; 增强现实技术是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术[20].综合其他主题发现, ACMMM会议主要呈现了新兴技术与信息检索的交互应用以及多媒体信息的搜索、推荐和评价. ... A Survey of Augmented Reality 1 1997 ... (2) ACMMM会议的主题则较为丰富, 其中涉及到较多与信息检索相关的新技术.人机交互是指人与计算机之间使用某种对话语言, 以一定的交互方式, 为完成确定任务的人与计算机之间的信息交换过程[18], 有关人机交互方面的研究从行为与事件识别转向人脸识别以及情感识别.近两年, 虚拟现实与增强现实也成为ACMMM会议的热门研究主题, 虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统[19]; 增强现实技术是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术[20].综合其他主题发现, ACMMM会议主要呈现了新兴技术与信息检索的交互应用以及多媒体信息的搜索、推荐和评价. ... Demand-Driven Clustering in Relational Domains for Predicting Adverse Drug Events 1 2012 ... (3) ICML会议则较为专注于研究聚类分析以及深度学习、增强学习和监督式学习等机器学习的子类方法.聚类分析是将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程, 其研究内容包括预测药物不良反应事件[21]以及子空间分割的多任务学习[22]等.综合来看, ICML侧重于探索机器学习与信息检索的融合以及对检索模型的研究. ... Multi-Task Learning for Subspace Segmentation 1 2015 ... (3) ICML会议则较为专注于研究聚类分析以及深度学习、增强学习和监督式学习等机器学习的子类方法.聚类分析是将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程, 其研究内容包括预测药物不良反应事件[21]以及子空间分割的多任务学习[22]等.综合来看, ICML侧重于探索机器学习与信息检索的融合以及对检索模型的研究. ... 推荐系统关键技术研究 1 2012 ... (4) KDD会议的主题倾向于各类数据的挖掘与知识发现, 挖掘形式从文本挖掘、图像挖掘到模式挖掘, 研究的情境从2012年-2014年的社交媒体到近两年的电子商务, 研究内容覆盖了网站应用、医疗健康、隐私与保密以及用户行为等.此外, 近5年KDD会议对推荐系统的研究也较为热门, 推荐系统是根据用户的兴趣特点和购买行为的过程, 向用户推荐用户感兴趣的信息和商品, 其推荐方法包括基于内容推荐、基于关联规则推荐、基于知识推荐和组合推荐等[23].从以上主题中可以看出, 信息检索与数据挖掘息息相关, 两者的综合应用前景广阔. ... 推荐系统关键技术研究 1 2012 ... (4) KDD会议的主题倾向于各类数据的挖掘与知识发现, 挖掘形式从文本挖掘、图像挖掘到模式挖掘, 研究的情境从2012年-2014年的社交媒体到近两年的电子商务, 研究内容覆盖了网站应用、医疗健康、隐私与保密以及用户行为等.此外, 近5年KDD会议对推荐系统的研究也较为热门, 推荐系统是根据用户的兴趣特点和购买行为的过程, 向用户推荐用户感兴趣的信息和商品, 其推荐方法包括基于内容推荐、基于关联规则推荐、基于知识推荐和组合推荐等[23].从以上主题中可以看出, 信息检索与数据挖掘息息相关, 两者的综合应用前景广阔. ... Scalable Semantic Matching of Queries to Ads in Sponsored Search Advertising 1 2016 ... (5) SIGIR会议的研究主题大多集中在信息检索技术以及应用, 且研究内容由搜索日志分析、文本分类以及检索模型转向搜索算法、搜索效果评价和问答系统等; 此外, SIGIR会议的主题中涉及用户研究的也比较多, 如个性化推荐、情感分析、用户行为以及搜索体验和满意度等, 总的来看, SIGIR会议各年度论文主题推陈出新, 如对于赞助商搜索广告的语义匹配研究[24]以及通过探索在线用户行为来提高个性化音乐检索效率[25], 信息检索的研究范畴正在逐渐扩大. ... On Effective Personalized Music Retrieval by Exploring Online User Behaviors 1 2016 ... (5) SIGIR会议的研究主题大多集中在信息检索技术以及应用, 且研究内容由搜索日志分析、文本分类以及检索模型转向搜索算法、搜索效果评价和问答系统等; 此外, SIGIR会议的主题中涉及用户研究的也比较多, 如个性化推荐、情感分析、用户行为以及搜索体验和满意度等, 总的来看, SIGIR会议各年度论文主题推陈出新, 如对于赞助商搜索广告的语义匹配研究[24]以及通过探索在线用户行为来提高个性化音乐检索效率[25], 信息检索的研究范畴正在逐渐扩大. ... An Exploration of Ranking Heuristics in Mobile Local Search 1 2012 ... (1) 移动搜索与周边的商家及服务密不可分.基于移动搜索和PC搜索的不同, Lv等通过数据分析了用户在移动设备上的搜索日志[26]. ... Towards Better Measurement of Attention and Satisfaction in Mobile Search 1 2014 ... (2) 用户行为是目前整个学术界的研究热点, 用户移动搜索行为也在信息检索领域中有所涉及.Lagun等通过实验研究了用户在移动搜索中对移动设备视窗的注意情况[27]. ... Is This Your Final Answer? Evaluating the Effect of Answers on Good Abandonment in Mobile Search 1 2016 ... (3) 较多学者正在评估用户对移动搜索的满意度.Williams等研究了搜索答案对于移动搜索用户的影响以及用户相应的满意度[28]. ... 近几年来国外信息检索模型研究进展 1 2008 ... 信息检索模型是信息检索的主要研究内容, 其运用数学或其他语言与工具, 对于信息检索的查询和文档及其匹配程度进行抽象描述, 目前的信息检索模型包括布尔模型、向量空间模型、概率模型、语言模型以及基于本体的检索模型等[29].各会议对于布尔模型的研究较少, 而主要关注其他模型的优化和拓展应用.从这些相关论文中可以看出: ... 近几年来国外信息检索模型研究进展 1 2008 ... 信息检索模型是信息检索的主要研究内容, 其运用数学或其他语言与工具, 对于信息检索的查询和文档及其匹配程度进行抽象描述, 目前的信息检索模型包括布尔模型、向量空间模型、概率模型、语言模型以及基于本体的检索模型等[29].各会议对于布尔模型的研究较少, 而主要关注其他模型的优化和拓展应用.从这些相关论文中可以看出: ... Language Intent Models for Inferring User Browsing Behavior 1 2012 ... (1) 语言模型是当前最受关注的信息检索模型, 无论是在社交网站上的应用, 还是运用到多媒体检索或特定文档的检索任务.Tsagkias等开发了推断用户浏览行为的语言动机模型[30]; Chen等则将多峰语言模型用于演讲视频检索中[31]; Raviv等研究了基于实体的语言模型在小说文档中的检索效果[32]. ... Multi-modal Language Models for Lecture Video Retrieval 1 2014 ... (1) 语言模型是当前最受关注的信息检索模型, 无论是在社交网站上的应用, 还是运用到多媒体检索或特定文档的检索任务.Tsagkias等开发了推断用户浏览行为的语言动机模型[30]; Chen等则将多峰语言模型用于演讲视频检索中[31]; Raviv等研究了基于实体的语言模型在小说文档中的检索效果[32]. ... Document Retrieval Using Entity-Based Language Models 1 2016 ... (1) 语言模型是当前最受关注的信息检索模型, 无论是在社交网站上的应用, 还是运用到多媒体检索或特定文档的检索任务.Tsagkias等开发了推断用户浏览行为的语言动机模型[30]; Chen等则将多峰语言模型用于演讲视频检索中[31]; Raviv等研究了基于实体的语言模型在小说文档中的检索效果[32]. ... An Enhanced Context-Sensitive Proximity Model for Probabilistic Information Retrieval 1 2014 ... (2) 概率模型则更多地用于提高检索的效率.Zhao等构建了上下文相关的邻近检索模型以提升检索的效率[33]. ... Using Collaborative Filtering to Weave an Information Tapestry 1 1992 ... (1) 协同过滤是利用某兴趣相投、拥有共同经验的群体的喜好来推荐用户感兴趣的信息, 其突出优点在于能够结合其他人的经验, 过滤机器难以自动内容分析的信息, 避免了内容分析的不完全或不精确[34].Shih等提出了一种提升协同过滤中评价较少项目的方法[35]. ... Dynamically Integrating Item Exposure with Rating Prediction in Collaborative Filtering 1 2016 ... (1) 协同过滤是利用某兴趣相投、拥有共同经验的群体的喜好来推荐用户感兴趣的信息, 其突出优点在于能够结合其他人的经验, 过滤机器难以自动内容分析的信息, 避免了内容分析的不完全或不精确[34].Shih等提出了一种提升协同过滤中评价较少项目的方法[35]. ... Real-Time Top-R Topic Detection on Twitter with Topic Hijack Filtering 1 2015 ... (2) 学者们对社交媒体内容的推荐以及相关研究颇有兴趣.Hayashi等在研究Twitter信息检索时开发了一种将主题抽取和信息流过滤融合的流算法并应用于Twitter信息流中[36]. ... Computational Creativity Based Video Recommendation 1 2016 ... (3) 多媒体信息是当前信息检索领域中过滤与推荐研究关注的最热门内容.Lu等研究了基于创新计算的在线视频推荐系统[37]; Mao等以歌曲难度评级为依据开发了首个社交歌唱社区推荐系统[38]. ... Song Recommendation for Social Singing Community 1 2014 ... (3) 多媒体信息是当前信息检索领域中过滤与推荐研究关注的最热门内容.Lu等研究了基于创新计算的在线视频推荐系统[37]; Mao等以歌曲难度评级为依据开发了首个社交歌唱社区推荐系统[38]. ... An Unsupervised Approach to Anomaly Detection in Music Datasets 1 2016 ... (1) 机器学习应用于信息检索中的查询与鉴别.Lu等运用非监督式学习的方法系统地鉴别音乐数据集中的异常部分[39]. ... Transfer Learning for Cross-Lingual Sentiment Classification with Weakly Shared Deep Neural Networks 1 2016 ... (2) 神经网络在跨语言检索中的应用.Zhou等建立了一种弱共享深度神经网络结构来解决跨语言情感分类中源语言数据与目标语言数据的特征空间重叠问题[40]. ... Learning to Respond with Deep Neural Networks for Retrieval-Based Human-Computer Conversation System 1 2016 ... (3) 在机器学习中运用信息检索可以实现人机对话等多方面的功能.Yan等运用信息检索、自然语言处理等技术建立了人机之间的自动对话系统[41]. ... Privacy-Aware Image Classification and Search 1 2012 ... (1) 信息检索广泛应用于社交媒体用户的隐私保护问题.Zerr等提出一种自动检测隐私照片的技术并开发了基于隐私意识的照片分类检索系统[42]. ... Calibrating Noise to Sensitivity in Private Data Analysis 1 2006 ... (2) 差分隐私(Differential Privacy)是基于数据失真的隐私保护技术, 通过向查询或者分析结果中添加噪音使数据失真, 从而达到隐私保护的目的[43].Zhang等介绍了一种利用差分隐私技术将查询日志匿名化的检索框架[44]. ... Anonymizing Query Logs by Differential Privacy 1 2016 ... (2) 差分隐私(Differential Privacy)是基于数据失真的隐私保护技术, 通过向查询或者分析结果中添加噪音使数据失真, 从而达到隐私保护的目的[43].Zhang等介绍了一种利用差分隐私技术将查询日志匿名化的检索框架[44]. ... Topic Model Based Privacy Protection in Personalized Web Search 1 2016 ... (3) 信息检索还用于研究个性化网络搜索中的隐私问题.Ahmad等提出了建立在客户端基于主题的隐私保护措施以解决搜索引擎保存用户历史搜索记录可能产生的隐私问题[45]. ... Interactions Between Health Searchers and Search Engines 1 2014 ... (1) 医疗信息检索的质量和效果是学者们所重点关注的.Schoenherr等研究了挖掘健康信息的查询和搜索历史的潜在策略[46]. ... Health Monitoring on Social Media over Time 1 2016 ... (2) 通过信息检索可以实现对用户健康状况的监控.Sidana等运用主题模型的思想提出了一种新的潜在疾病模型[47]. ...


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有