第四节 计算机信息检索的基本原理
信息检索语言
重要程度:7 分
<h2>信息检索语言</h2>
<p>信息检索语言是用于描述、标识和组织信息资源的一种规范化语言,它帮助用户高效地查找所需的信息。</p>
<h3>关键词</h3>
<p>关键词是最基本的信息检索语言元素,它是文档中具有实质意义的词语,能够反映文档的主题内容。例如,一篇关于“人工智能”的文章,其关键词可能包括“机器学习”、“深度学习”、“自然语言处理”等。</p>
<h3>主题词</h3>
<p>主题词是一种经过规范化处理的词汇,通常由专业人员或机构编制并维护,用于提高检索的准确性。例如,在医学领域,“冠状动脉疾病”可能会被规范为主题词“冠心病”。使用主题词检索时,系统会自动匹配相关的同义词和近义词,从而提高查全率和查准率。</p>
<h3>分类号</h3>
<p>分类号是根据文献内容所属学科领域,按照一定的分类体系赋予的代码。例如,《中国图书馆分类法》将所有图书分为22个大类,每个大类又细分为若干子类。如“计算机科学”类目下的分类号为TP,其中TP3表示“计算机硬件技术”,TP311表示“计算机硬件结构”,TP39表示“计算机应用”。因此,一本关于计算机网络的书籍可能会被归类为TP39。</p>
<h4>例题</h4>
<p>假设你正在查找有关“机器学习”的信息:</p>
<ul>
<li>使用关键词检索:输入“机器学习”作为关键词,可以找到包含这些词的文章。</li>
<li>使用主题词检索:输入主题词“机器学习”,系统可能会扩展到“机器学习算法”、“机器学习应用”等相关的主题词。</li>
<li>使用分类号检索:输入分类号TP18,可以找到属于“自动化技术、计算技术”这一大类下的所有信息资源。</li>
</ul>