<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>暗网</title>
	<atom:link href="https://www.aitaocui.cn/tag/160089/feed" rel="self" type="application/rss+xml" />
	<link>https://www.aitaocui.cn</link>
	<description>翡翠玉石爱好者聚集地</description>
	<lastBuildDate>Tue, 22 Nov 2022 15:51:22 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.1.1</generator>

<image>
	<url>https://www.aitaocui.cn/wp-content/uploads/2022/11/taocui.png</url>
	<title>暗网</title>
	<link>https://www.aitaocui.cn</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>暗网(隐藏网络)</title>
		<link>https://www.aitaocui.cn/article/254389.html</link>
					<comments>https://www.aitaocui.cn/article/254389.html#respond</comments>
		
		<dc:creator><![CDATA[万华禾香板]]></dc:creator>
		<pubDate>Tue, 22 Nov 2022 15:51:22 +0000</pubDate>
				<category><![CDATA[百科]]></category>
		<category><![CDATA[暗网]]></category>
		<guid isPermaLink="false">https://www.aitaocui.cn/?p=254389</guid>

					<description><![CDATA[暗网（作深网，不可见网，隐藏网）是指那些存储在网络数据库里、不能通过超链接访问而需要通过动态网页技术访问的资源集合，不属于那些可以被标准搜索引擎索引的表面网络。迈克尔·伯格曼将当今...]]></description>
										<content:encoded><![CDATA[</p>
<article>
<p>暗网（作深网，不可见网，隐藏网）是指那些存储在网络数据库里、不能通过超链接访问而需要通过动态网页技术访问的资源集合，不属于那些可以被标准搜索引擎索引的表面网络。迈克尔·伯格曼将当今互联网上的搜索服务比喻为像在地球的海洋表面的拉起一个大网的搜索，大量的表面信息固然可以通过这种方式被查找得到，可是还有相当大量的信息由于隐藏在深处而被搜索引擎错失掉。绝大部分这些隐藏的信息是须通过动态请求产生的网页信息，而标准的搜索引擎却无法对其进行查找。传统的搜索引擎“看”不到，也获取不了这些存在于暗网的内容，除非通过特定的搜查这些页面才会动态产生。于是相对的，暗网就隐藏了起来。</p>
</article>
<article>
<h1>暗网的定义</h1>
<p>暗网（作深网，不可见网，隐藏网）是指那些存储在网络数据库里、不能通过超链接访问而需要通过动态网页技术访问的资源集合，不属于那些可以被标准搜索引擎索引的表面网络。</p>
<p>迈克尔·伯格曼将当今互联网上的搜索服务比喻为像在地球的海洋表面的拉起一个大网的搜索，大量的表面信息固然可以通过这种方式被查找得到，可是还有相当大量的信息由于隐藏在深处而被搜索引擎错失掉。绝大部分这些隐藏的信息是须通过动态请求产生的网页信息，而标准的搜索引擎却无法对其进行查找。传统的搜索引擎“看”不到，也获取不了这些存在于暗网的内容，除非通过特定的搜查这些页面才会动态产生。于是相对的，暗网就隐藏了起来。</p>
<h1>来源现状</h1>
<p>HiddenWeb最初由Dr．JillEllsworth于1994年提出，指那些没有被任何搜索引擎索引注册的网站：</p>
<p>“这些网站可能已经被合理地设计出来了，但是他们却没有被任何搜索引擎编列索引，以至于事实上没有人能找到他们。我可以这样对这些不可见的网站说，你们是隐藏了的。”另外早期使用“不可见网络”这一术语的，是一家叫做“个人图书馆软件”公司的布鲁斯·芒特（产品开发总监）和马修·B·科尔（首席执行官和创建人），当他们公司在1996年12月推出和发行的一款软件时，他们对暗网工具的有过这样的一番描述：</p>
<p>不可见网络这一术语其实并不准确,它描述的只是那些在暗网中，可被搜索的数据库不被标准搜索引擎索引和查询的内容，而对于知道如何进入访问这些内容的人来说，它们又是相当可见的。</p>
<p>第一次使用暗网这一特定术语，是2001年伯格曼的研究当中。</p>
<p>从信息量来讲，与能够索引的数据相比，“暗网”更是要庞大得多。根据BrightPlanet公司此前发布的一个名为《TheDeepWeb-SurfacingTheHiddenValue》（深层次网络，隐藏的价值）白皮书中提供的数据，“暗网”包含100亿个不重复的表单，其包含的信息量是“非暗网”的40倍，有效高质内容总量至少是后者的1000倍到2000倍。更让人无所适从的是，BrightPlanet发现，无数网站越来越像孤立的系统，似乎没有打算与别的网站共享信息，如此一来，“暗网”已经成为互联网新信息增长的最大来源，也就是说，互联网正在变得“越来越暗”。</p>
<p>当然，所谓“暗网”，并不是真正的“不可见”，对于知道如何访问这些内容的人来说，它们无疑是可见的。2001年，ChristSherman、GaryPrice对HiddenWeb定义为：虽然通过互联网可以获取，但普通搜索引擎由于受技术限制而不能或不作索引的那些文本页、文件或其它通常是高质量、权威的信息。根据对HiddenWeb的调查文献得到了如下有意义的发现：</p>
<p>(1)HiddenWeb大约有307,000个站点，450,000个后台数据库和1,258,000个查询接口。它仍在迅速增长，从2000年到2004年，它增长了3～7倍。</p>
<p>(2)HiddenWeb内容分布于多种不同的主题领域，电子商务是主要的驱动力量，但非商业领域相对占更大比重。</p>
<p>(3)当今的爬虫并非完全爬行不到HiddenWeb后台数据库内，一些主要的搜索引擎已经复盖HiddenWeb大约三分之一的内容。然而，在复盖率上当前搜索引擎存在技术上的本质缺陷。</p>
<p>(4)HiddenWeb中的后台数据库大多是结构化的，其中结构化的是非结构化的3．4倍之多。</p>
<p>(5)虽然一些HiddenWeb目录服务已经开始索引Web数据库，但是它们的复盖率比较小，仅为0．2%～15．6%。</p>
<p>(6)Web数据库往往位于站点浅层，多达94%的Web数据库可以在站点前3层发现。</p>
<h1>暗网分类</h1>
<p>它分为两种：</p>
<p>一种是技术的原因，很多网站本身不规范、或者说互联网本身缺少统一规则，导致了搜索引擎的爬虫无法识别这些网站内容并抓取，这不是搜索引擎自身就能解决的问题，而是有赖整个网络结构的规范化，百度的“阿拉丁计划”、谷歌的“云计算”就是要从根本解决这一问题。</p>
<p>另一个原因则是很多网站根本就不愿意被搜索引擎抓取，比如考虑到版权保护内容、个人隐私内容等等，很多网站都在屏蔽百度、比如视频网站优酷也宣布屏蔽百度一样，这更不是搜索引擎能解决的问题了。如果他们能被搜索引擎抓取到，就属于违法了。</p>
<p>数据显示，能够搜索到的数据仅占全部信息量的千分之二。而对暗网的发掘能扩大搜索数据库，使人们能够在搜索引擎上搜索到更多的网页、信息。</p>
<p>几乎任何有抱负的通用搜索引擎都有一个共同的梦想：整合人类所有信息，并让大家用最便捷的方式各取所需。</p>
<p>对此，百度说：“让人们最便捷地获取信息，找到所求”；谷歌说：“整合全球信息，使人人皆可访问并从中受益”。这两者表达的实际上是同一个愿景。</p>
<p>然而，这注定是一项不可能完成的任务。据科学家估测，人类信息大概只有0.2%实现了web化，并且这个比例很可能在持续降低。更甚的是，即便在已经Web化的信息中，搜索引擎的蜘蛛能抓取到的和不能抓取到的比例为1:500。</p>
<p>万里长征的第一步即是对付“暗网”。所谓“暗网”，简言之即为“搜索引擎抓取不到的网页数据”。点亮“暗网”早已纳入各大搜索引擎的日程之中，很明显，这将是一场旷日持久的战争。</p>
<h1>警惕</h1>
<p>今年6月，云南省罗平县人民法院也公布了一起利用“暗网”侵犯公民个人信息的案例。被告人在境外网站发帖，标明提供个人户籍、全家户籍、开房记录、同住记录等公民个人信息的服务项目及价格，并在“暗网”市场上以比特币交易，于2018年4月至11月期间，非法获取、出售多人个人信息1000余条，获利1.33315比特币，并将1.30948比特币兑换成人民币41397.35元。</p>
<p>5月7日，江苏省南通市公安局公布，经过4个多月的缜密侦查，江苏南通、如东两级公安机关破获了一起特大“暗网”侵犯公民个人信息案，抓获犯罪嫌疑人27名，查获被售卖的公民个人信息数据5000多万条。这起案件也被公安部列为2019年以来全国公安机关侦破的10起侵犯公民个人信息违法犯罪典型案件之一。</p>
</article>
<div class="mt-3 mb-3" style="max-width: 770px;height: auto;">
                                    </div>
<div class="mt-3 mb-3" style="max-width: 770px;height: auto;">
                                    </div>
<div class="mt-3 mb-3" style="max-width: 770px;height: auto;">
                                    </div>
]]></content:encoded>
					
					<wfw:commentRss>https://www.aitaocui.cn/article/254389.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
