查看原文
其他

【开源情报培训】搜索战略/搜索方法

dingba 丁爸 情报分析师的工具箱 2023-01-02

本文机器翻译由百分点智能翻译提供

官网地址:http://translate.percent.cn/

公司官网:https://www.percent.cn/


本文节选自北约开源情报培训课程《互联网情报开发》。

在搜索前做好准备

支持你研究的在线资源世界在不断扩大。因此,在先研究搜索头之前,最好考虑一下您的选项。在线资源包括:


•      图书馆目录

大多数图书馆都有藏书目录。大多数州立和教育机构的图书馆是图书馆联合会的成员,你可以通过它们的搜索引擎搜索会员机构的收藏。您可以使用这个函数来查找更难查找的资源,如稀有书籍、期刊、杂志等。

•      参考数据库

这包括百科全书,期刊索引和全文资源,图书馆授权出版商使用它。使用这些数据库来识别(和阅读)关于各种主题的文章。

•      因特网资源

这些都是人人都可以使用的互联网搜索工具。然而,必须指出,越来越多的高质量数据库可以通过因特网访问,但费用与其使用有关。

因为这些资源是由不同的组织创建的,所以它们看起来或功能都不一样。好消息是关键搜索技能可用于所有这些在线资源,以帮助您快速连接到您需要的信息。本节描述了成功搜索的六个步骤。

1:确定关键概念

2:确定可能的搜索术语

3:决定使用哪种方法进行搜索

4:构建您的搜索

5:限制你的搜索

6:完善你的搜索

步骤1:确定关键概念

成功搜索的关键是做好准备。第一步有两个部分:

首先,在开始搜索之前,花一点时间分析你的搜索主题。写一个句子描述你在寻找什么。

其次,识别:

1.    主要概念(提示:这些通常是名词,而不是动词、副词或形容词)

在下面的说明中,关键概念是"药物滥用"和"治疗"。

2.    这个主题的任何方面(如时间、地点)都有助于集中你的研究。

在下面的插图中,有些方面是“近期”和“美国”。

美国药物滥用治疗的近期改进?

步骤2:确定可能的搜索术语

接下来,列出可以用来表达每个主要概念的单词列表。在进行这项工作时,考虑:

1.在搜索中是否有更窄或更宽的术语?

例如,"药物滥用"是一个广泛的概念。它可能涉及滥用各种物质,如酒精、药物或烟草。如下表所示,这些类别中的每一个都具有较窄的方面。

广义术语:

药物滥用

缩小:

酒精

药物药物

烟草烟草

叙事者:

啤酒威士忌酒

可卡因、海洛因、大麻

香烟雪茄鼻烟

 

2.    同义词呢?有没有不同的方式来描述你的概念?例如,“毒品”的一些同义词是“毒品、麻醉剂、阿片剂”。

通常你可以想到同义词,但你也可以使用同义词库来定位同义词。甚至还有网上消息来源,如《词汇神话教育词典-词汇词典》(http://www.wordsmyth.net/)

主题开发工作表

下面的工作表是一个有用的工具,可以开发一个从一般概念到特定搜索术语的特定主题。在按下任何键之前考虑搜索花费的时间可以显著增加搜索的准确性和完整性。

步骤3:决定使用哪种方法进行搜索

搜索在线源最常用的两种方法是主题法和关键字法。然而,也有短语、概念和自然语言搜索。

1、基于主题

HOW:使用由编辑器识别的标准术语或“主题标题”来表示文档的主要焦点。

WHERE:图书馆目录和大多数参考数据库都可以按主题搜索。然而,网站的索引(比如Google或AltaVista)没有这个特性。

效率:主题搜索是寻找信息的精确(因此也是有效的)方法。它将帮助您找到相关信息,而不管不同的作者可能用来描述主题的不同术语。


最佳用途:因为你可以精确搜索(而不是检索不相关的信息),使用此方法时,你的研究主题是广泛的(如“药物滥用”)或含糊不清(如“哥伦布”-你需要关于俄亥俄州的城市或克里斯托弗哥伦布的信息?)


需求:您必须将搜索概念转换为数据库使用的主题词汇表。有时很难确定正确的主题术语。另外,在一个数据库中工作的术语可能不会被另一个使用(如下所示),因此您应该检查正在使用的数据库的主题列表(“词库”)。

数据库:

主题词:

主题标题:

OSCAR

国会主题图书馆

药物滥用

Medline

医疗小标题

与物质有关的疾病

PsycINFO

心理索引词表

药物滥用

2、基于关键词

HOW:使用文档中某个地方可能出现的单词,如资源本身的标题、描述(抽象)或全文。

where:在搜索web索引时使用此方法。图书馆目录和参考数据库也允许关键字搜索。

效率:关键字搜索是查找信息的一种不那么精确(通常效率较低)的方法。因为关键字搜索查看文档中所包含的所有单词(不仅仅是主题标题),它会找到更多的结果供您筛选,而且许多可能不相关。


关键字搜索也不能区分不同的含义。

例如,如果您希望获得有关土耳其(国家)的信息,那么您可能还会在关键字搜索的结果中找到关于火鸡(鸟)的资源。

最佳用途:当您的研究主题是具体的(如“怀孕期间的药物滥用”)或者上面写得不多时,使用关键字搜索。

如果数据库同时允许关键字和主题搜索,那么当您不确定数据库中使用哪些术语来描述主题时,也可以使用关键字搜索来识别主题标题。浏览关键字搜索返回的结果,并找到看起来有用的项。然后,在一个新的主题搜索中使用这个项目的主题标题,以便找到关于你的研究主题的更多信息。

需求:如果使用多个关键字,则必须构建搜索语句。您的语句将使用“操作符”连接搜索单词。不同的操作人员会产生不同的效果。



图书馆数据库中的关键词检索

插图显示了在期刊摘要中搜索关键词:药物滥用怀孕的记录

•     "药物滥用"见于期刊标题和主题标题。

•      “怀孕”出现在另一个标题中。

3、Web索引中的关键字搜索

图解显示了通过快速搜索关键字发现的第一个结果:药物滥用怀孕

•      "药物滥用"和"怀孕"都在网页标题中找到。

•      这些单词也在页面文本中找到(它们用浅色高亮显示)。

因为这是一个网络索引,所以没有主题标题可以用来扩展您的搜索。

步骤4:构建您的搜索

在这个阶段,您已经识别了主要的搜索概念,开发了与每个概念相关的搜索单词列表,并选择了一种方法(主题或关键字)。

使用关键字方法,您可以键入一些搜索单词并获得结果,但是这种方法的结果是不可预测的,并且常常不能令人满意。要执行有效的关键字搜索,您必须制定搜索语句。这包括:

a.     选择操作符连接搜索词

b.    识别作为短语的任何搜索项

c.      决定是否包括词变体

d.     使用括号组织任何复杂的搜索语句。

a、选择操作符连接搜索词

有几种不同类型的“操作符”可用于连接搜索单词。有时你会把这些操作符和搜索词一起输入搜索框。有时候,您会选择一个选项来连接下拉列表中的搜索词,如下图所示。

使用布尔运算符

一些数据库使用称为布尔运算符的特殊连接词来组合搜索项。最常用的布尔运算符是:AND,OR,NOT。

搜索:

发生了什么?

成瘾和治疗

要求所有这些词都出现在结果中; 使用AND连接概念

可卡因或快克

这些单词中的任何一个都可以出现在结果中;使用OR连接同义词

非处方药

从结果中排除词语

使用数学运算符号

有些数据库允许您使用布尔运算符(词)或数学运算符(符号)来组合搜索项。这些数学运算符是加号(+)和负号(-)。

搜索:

发生了什么?

-戒毒治疗

要求所有这些词都出现在结果中,比如布尔运算符AND。

+药物-处方

从结果中排除单词,比如布尔运算符not。

注意:间隔计数。在使用数学运算符构造搜索语句时,一定要正确地格式化它们,以便搜索按预期工作:

•      不要在数学符号和搜索词之间留出空间。

•      DO在每个元素之间留出空间(符号加上搜索项)。

始终如一

在搜索语句中使用单词或符号作为操作符。不要把它们混在一起。

正确使用:+上瘾+治疗

使用不当:+上瘾和治疗

隐含运算符

如果不使用任何操作符会发生什么?在许多数据库中,一个布尔运算符(AND或OR)是隐含的,因此由系统自动提供。对此没有标准,因此您必须检查数据库HELP页面以找出隐含哪个操作符。

b、识别搜索短语

在构建搜索语句时,必须识别任何应被视为短语的单词。在线使用各种方法来搜索短语。根据数据库,可能需要:

1.    用引号附上一个准确的短语

2.    从下拉菜单中选择短语搜索选项

3.    使用诸如NEAR或ADJ之类的布尔运算符来指示术语的接近

搜索:

发生了什么?

近地药物滥用

在任何顺序中找到两个单词(通常在同一个句子中)。这一搜索将找到"滥用药物"和"滥用受控物质"的准确短语。

ADJ物质滥用

在任何顺序中找到两个相邻单词。

"药物滥用"

这两个词按这个顺序排列在一起。

 

NEAR和ADJ是有用的布尔运算符,但它们并非所有数据库都普遍支持。如果您正在使用的数据库中有它们(请检查HELP以查找),在不确定短语中的单词顺序时,使用NEAR或ADJ代替引号。

注意,短语或接近搜索比使用AND运算符更具限制性。使用引号围绕确切短语或ADJ操作符之间

形成短语的单词将产生更小、更精确的结果,但不总是更准确。如果不小心,使用这些搜索技术可能会过度地缩小你的搜索。

摘要

下表总结了各种操作人员对搜索结果的影响,从最小限制(产生最大结果集)到最大限制(产生最小结果集)。

操作员:

实例:

网络搜索结果

花生或黄油或饼干

1 499 578页

和(或加号)

花生、黄油和饼干

33 534页

近地

花生酱和饼干

10 591页

ADJ

花生ADJ黄油ADJ饼干

5 291页

短语指示器

“花生酱饼干”

3 838页

 

例如,为了找到花生酱饼干的食谱,最有效的搜索语句是:

使用布尔运算符:“花生酱饼干”和食谱

使用数学运算符:+“花生酱饼干”+食谱

c、包括搜索词的不同形式

许多数据库确实执行搜索。如果搜索单词的单数形式(如猫),则找不到复数形式(猫)。但数据库通常有一个通配符特性,您可以用它来查找搜索词的变体。

通常,您必须包含一些符号,例如问号(? )或词根末尾的星号(),以找到复数和相关形式。检查数据库HELP页以找出使用哪个符号。

实例:

•     搜索:物质?近地滥用?

•    会发现:滥用药物、滥用药物、滥用受控物质。有些数据库具有解决变异词形问题的源头特征。如果输入关键字“cats”,他们将自动搜索“cat”,反之亦然。

d、使用括号将搜索词分组

还可以通过使用圆括号将应该以同样方式处理的搜索词分组来创建更复杂的搜索语句。这有时称为“嵌套”,是一种将同义词或相关术语结合到搜索中的简便方法。

如下图所示,可以使用OR运算符将每个搜索概念的同义词或相关术语链接到集群”。在括号内填充一个集群。然后可以使用布尔运算符AND组合集群。


至少一个来自每个概念簇的单词应该在用于此搜索的结果中表示。

a.  关键词搜索的推荐策略

•      分阶段执行搜索。首先,搜索最重要的概念或者最独特的单词(那些最不可能发生在搜索结果中)。然后看看你的结果,并决定你是否需要改变任何事情。不要从复杂而复杂的搜索语句开始。相反,从一个简单的开始构建。

•      当你复习结果时,注意新的或替代的术语。把它们纳入你的下一次搜索。例如,使用"化学依赖性"和"药物滥用"。将这些搜索项与OR运算符连接以展开结果。

步骤5:限制你的搜索

搜索通常会返回比您可能使用的更多的信息。以前,我们看到,通过选择最合适的操作符,可以产生更好的结果。大多数在线数据库还允许您限制(屏幕)您的搜索结果以改善它们。

但是限制搜索的具体标准会有所不同。

图书馆目录和许多参考数据库提供了不同的标准或变量,可用于限制您的搜索结果。通常,您可以通过以下方式进行限制:

•      语言

•      媒体或材料类型

•       时限和出版日期

前限还是后限?一些库目录和数据库允许您对原始搜索表单设置限制(前限),以及在初始搜索返回结果之后(后限)。要发布限制,请在搜索结果页面上查找“限制”链接或按钮,如下图所示。

通常,后限制效果最好。首先,尝试你的搜索没有任何限制,看看什么结果产生。

然后,如果有太多内容需要快速查看(超过2页),那么将搜索结果后限一些看起来最相关的变量。

实例:

•      如果你的结果是许多不同的语言,尝试只限于英语语言。

•      如果您的结果应该是最近的,尝试限制发布日期。

Web索引中的限制

当搜索web索引时,一些相同的限制标准(例如语言)可能是可用的。然而,在web索引中,您还可以将搜索限制为网页中存在的各种元素,例如:

•      页标题

•      标题

•      URL

如果你的搜索词出现在网页的这些关键部分,它更有可能和你的需要相关。

示例:网络索引

右边的例子显示,谷歌,一个网络索引,搜索短语“俄亥俄州巴克利”。通过将此搜索限制为页面标题,我们将发现以此主题为主要焦点的网站。

关于“使用Web搜索工具”的net. TUTOR教程提供了关于如何在Web索引中使用限制特性的更多信息。

步骤6:完善你的搜索

搜索可能是不可预测的。有些搜索返回的信息太多。有时候,经过深思熟虑的搜索却找不到足够的信息。无论如何,大多数在线搜索都是“迭代”的,需要不断改进或调整您的搜索,如下图所示。

搜索过程流程图

下面是一些经过验证的调整关键字搜索的策略,它们发现太多或太少。

调整:

缩小结果:

扩大成果:

SEARC

概念

使用AND操作符添加搜索概念。

删除一些搜索概念。首先找到最重要的概念的信息。

SEARC

词汇

删除一些搜索词,特别是模糊、模糊或抽象的词。

使用OR运算符添加更多的搜索词。

SEARC

聚焦

将搜索焦点限制在特定字段或方面(日期、语言、媒体等)

将搜索焦点从主题扩展到关键字,或者从一个字段扩展到数据库的所有字段。

实例:

初步搜索:

"药物滥用"和治疗

•      结果太多了?通过添加新概念来缩小范围:

药物滥用”与治疗与俄亥俄州

•      结果太少了?通过添加更多搜索词进行扩展:

("药物滥用"或酗酒或酗酒或"药物滥用")和(治疗或治疗)


北约开源情报培训课程《互联网情报开发》


目录

导言

第一章:互联网概述

A节:万维网

B节:新闻

C节:电子邮件列表概述

D节:聊天

第二章:方向

A节:任务分析

任务分析步骤

步骤1:特派团的来源

第二步:上级的使命和意图

第3步:自己任务的衍生要素

步骤4:识别假设

步骤5:确定目标

B节:初级情报需求发展

方向发展工作文件

第三章:收集

A节:收藏规划

收集管理

制定收集计划

互联网收集计划

互联网收集计划步骤

步骤1:确定可搜索信息需求

步骤2:确定最佳站点或搜索

步骤3:识别访问或查找特定信息的详细信息

步骤4:确定搜索时间约束

使用互联网收集计划

常备需求

互联网收集计划

B节:搜索战略

搜索方法

在搜索前做好准备

步骤1:确定关键概念

步骤2:确定可能的搜索术语

步骤3:决定使用哪种方法进行搜索

步骤4:构建您的搜索

步骤5:限制你的搜索

步骤6:完善你的搜索

C节:搜索工作表

D节:搜索工具

搜索引擎

什么是搜索引擎?

搜索引擎如何工作?

搜索引擎的利弊是什么?

搜索引擎是一样的吗?

搜索引擎如何排名网页?

你什么时候使用搜索引擎?

主要搜索引擎-特征指南

搜索工具

泛滥

深层网络/隐形网络

搜索看不见的网络

深度查询管理器

E节:网上匿名搜索

第四章:处理

A节:来源评价

浅析信息资源

确定网页的来源

步骤1:研究URL

步骤2:在域名上做“妓女”

步骤3:对主机名执行跟踪程序

步骤4:阅读网页,并跟踪接触点

B节:评价清单

宣传网页的评价清单

商业/营销网页评估清单

新闻网页的评价清单

信息网页的评价清单

个人网页评估清单

C节:有效来源清单

D节:有效摘要

第五章:遣散

A节:报告编排

B节:微软展望

C节:传播和分类

附件:

附件A:关于来源评价的更多信息

附件B:选定的信息来源

a. 恐怖主义威胁研究

b. 敌对情报威胁研究

c. 刑事威胁研究

d. 医疗威胁

e. 地政、军事、国家情报研究

f. 地理政治和军事信息----俄罗斯附件

g. 地名录、港口、地貌和地图研究

原文及机翻译文档已上传小编知识星球


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存