如何挖掘网络资源[1]:网站的类型和使用场景

发布于:2023-07-22 15:18:57

*先来介绍一下网站的类型和特点。不同的网站特点将决定你挖掘资源的方式。

网站内容的指标

要挖掘互联网的资源,*先需要关注网站的内容。大致总结了几个指标,任何网站的内容,都具有这几个指标。

通过这些指标,可以评估某个网站【对你的价值】到底有多大,还可以评估你挖掘其中的内容需要耗费多少时间和精力。

内容的信噪比

任何一个网站的内容,都会有一些信息是无用的,咱们称之为“噪声”。所谓的【信噪比】,就是是“有用信息”与“垃圾噪声”的比率。显然,信噪比越大越好。

提醒一下:信噪比的评价是主观的。因为每个人的关注点(价值取向)不同,所以同样的内容,对不同的人,会有不同的信噪比。

内容的可搜索性

主要指网站的内容是否容易被搜索引擎检索和收录。这个指标是客观的。

内容的生命周期

主要指网站内容的生命周期的长短。关于信息的生命周期,稍微解释一下:对于某个信息而言,只有在它的生命周期之内,该信息才有价值;过了生命周期,就没有价值。

举例:

比如美国大选之前,某人制作了一个分析报告,分析竞选双方的得票率。那么,当大选结果揭晓之后,这个报告的生命周期就结束了。

这个指标是半主观半客观的。

我通常关注那些生命周期较长的内容。因为在网上冲浪是需要消耗时间和精力的。如果你关注的都是生命周期很短的信息,从“投资回报率”的角度来看,是不合算的!

内容的组织性

指的是网站的不同内容之间,是否具有较好的分类,是否具有较好的层次,是否具有较好的关联。

这个指标是客观的。

组织性越好,你就越容易找到该网站的其它感兴趣的内容。

网站的类型

互联网上的网站,大致上可以分为“功能型”和“内容型”。如果你要在网上找自己感兴趣的资源,“内容型”网站才是你的最终目标。

“内容型”的网站的网站,按照内容创建的方式,大体上可以分为“Web 1.0”和“Web 2.0”两大类。这两类的区别如下:

“Web 1.0”——网站内容由专职的网站编辑创建

“Web 2.0”——网站内容用户创建,英文叫“UGC”

对于 Web 2.0 的网站,还可以再细分为如下几类:

论坛类(BBS、邮件列表)、博客类(包括轻博客)、微博客(Micro Blog)、社交类(SNS)、文件共享类、百科类、问答类、等等。

对于上述这些分类,分别介绍一下。

Web 1.0

Web 1.0 的典型代表,包括早期的门户网站、某些专业类网站、某些报考杂志的Web版、等等。

内容的可搜索性

这类网站通常是“搜索引擎友好”的,甚至还会针对搜索引擎做优化(SEO)。因为这类网站需要利用搜索引擎帮它带来用户流量。

内容的组织性

这类网站的内容是由专职编辑维护的,所以内容的组织性通常比较好。比如网站通常会有分类导航,相关的网页之间会有超链接。

内容的生命周期

如果是专业性的网站,内容的生命周期一般比较长;如果是新闻类的,则比较短。

内容的信噪比

对于新闻类的网站,信噪比通常不会太好。对于专业类的网站,则视具体情况而定。

我的使用场景

我平常不会主动去逛那些 Web 1.0 的网站。

通常是在搜索引擎中找某关键字,然后跳转到该网站的某篇文章。

如果觉得这篇文章的质量差,直接关掉。

如果觉得这篇文章的质量好,会顺便浏览该网站相关的文章(根据站内导航、文章的交叉链接)。

如果浏览了多篇文章之后,发现总体的质量较好,会把该网站加入自己的收藏或者是订阅该网站的 RSS(如果有的话)。

论坛类(BBS)

论坛类的网站,早在 Web 2.0 概念提出之前,就已经很流行了。

内容的可搜索性

大部分论坛的内容,是无需登录即可浏览的。所以大部分论坛都是可搜索的;*少数是不开放的,则搜索引擎无法收录论坛内容。

内容的组织性

论坛里面的帖子,通常会根据类型分在不同的板块。板块内的帖子,通常只提供排序功能(比如 按时间、浏览数、回帖数 等),有些论坛可以按照发帖人来组织帖子。

总的来说,论坛类内容的组织性,算中上。

内容的生命周期

这取决于论坛的定位。不同的论坛,差异较大。

比如:一个讨论娱乐圈八卦的论坛,帖子的生命周期就比较短;而一个讨论哲学的论坛,帖子的生命周期相对较长。

内容的信噪比

大部分论坛的信噪比都不好——灌水的比例居高不下。有些论坛的版主会专门整理一个精华区,那么信噪比会有所改善。

我的的使用场景

传统的BBS,没注册过帐号;邮件列表倒是注册过几个。

平时我不会主动去逛论坛类网站。

通常是在搜索引擎中找某关键字,然后跳转到某论坛的某帖子。

如果我觉得这篇文章的质量差,直接关掉。

如果觉得这篇文章的质量好而且是原创,会顺便浏览该发帖人的相关文章(这种情况不多见)。

博客类(Blog)

内容的可搜索性

这类网站通常是“搜索引擎友好”的,因为这类网站需要利用搜索引擎帮它带来用户流量。

内容的组织性

大部分博客都支持分类导航或者是标签(Tag)导航,某些博客之间还会搞交换链接。

组织性算是好的。

内容的生命周期

这个视具体的博客而定。

内容的信噪比

总的来说,博客的信噪比好于论坛、SNS、微博客。

我的使用场景

博客类网站是我的主要信息来源之一。关于博客类网站的信息获取,会在本系列后面专门介绍。

微博类(MicroBlog)

微博是最近几年突然火爆起来的。国外*屈一指的当属“Twitter”,国内有“新浪微博”。

内容的可搜索性

通常情况下,微博是可搜索的。但是,某些做成长微博的图片,其内容是不可搜索的。

内容的组织性

内容的组织较差,通常是根据时间轴组织内容。

信息的碎片化非常非常严重。

内容的生命周期

微博的内容,通常生命周期都很短。你设想一下,你会去看某人在一个月之前发的微博内容吗?甚至2-3天之前的内容,就已经没人关注了。

内容的信噪比

在这几种类型的网站中,微博的信噪比估计是最差的。里面充斥着大量的噪声,还有大量同质化的信息。

微博我已经卸载,对于好坏不做评论。我是觉得自己在上面获得的有效信息比较少,热搜可以买,有什么可看的呢?

社交类(SNS)

SNS 已经火了好几年了。国外*屈一指的当属“Facebook”,国内有知乎,微信

内容的可搜索性

有的 SNS 对搜索引擎友好(比如 G+),有些则不友好(比如 Facebook)

内容的组织性

通常是按照用户来组织组织;对于具体的用户,再按照时间轴组织内容。

信息有不同程度的碎片化(视具体网站的具体用户而定)。总的来说,内容的组织性“中下”。

内容的生命周期

总的来说,内容的生命周期比博客短,比微博长。

内容的信噪比

总的来说,SNS的信噪比不如博客,好于微博。

我的使用场景

我很早就注册过 Facebook,G+ 推出后也注册了。不过平时很少用。通常是在搜索引擎中找某关键字,然后跳转到 SNS 网站的某页面。如果觉得该页面的内容没价值,直接关掉。

如果觉得该页面的内容有价值,再去看看该 SNS 用户的其它内容。如果该 SNS 用户的很多内容都不错,看看此人是否有博客,有的话就订阅。

百科类

百科类网站,全球*屈一指的当然是“维基百科”,国内有的“百度百科”和“互动百科”。

内容的可搜索性

这类网站通常是“搜索引擎友好”的,甚至还会针对搜索引擎做优化(SEO)。因为这类网站需要利用搜索引擎帮它带来用户流量。

内容的组织性

通常会有良好的分类组织,词条之间会有很多交叉连接。总的来说,内容组织性较好。

内容的生命周期

百科类网站的内容,通常生命周期很长。

内容的信噪比

百科类网站的词条,通常是以多人协作的方式维护的,一般不会有垃圾信息。

总的来说,信噪比很好

我的使用场景

我通常用维基百科。因为维基百科的词条最多,支持多种语言(可惜我只看懂中文和英文),而且不存在"和谐"的问题。国内的百科类网站,政治敏感内容是查不到滴。

当接触到一个不熟悉的词汇,通常会先用搜索引擎搜该词条的维基百科。

看完维基百科对该词条的解释之后,如果意犹未尽,就再看看跟该词条相关的其它词条。

维基百科包含大多数主流的语言。所以有时候看完中文的词条,再去看看对应的英文词条。

文件共享类

文件共享类的网站,有时候又称为“网盘”。不同的文件共享网站,内容和功能差异较大,现在用的比较多是百度网盘。

内容的可搜索性

在文件共享类网站中,有的是提供 Web 界面的——这类网站通常是搜索引擎友好的;还有一些是通过专门的 P2P 软件进行文件分享和下载的,搜索引擎未必能收录其内容。

即使是 Web 界面的文件共享,搜索引擎通常只能收录文件名,无法抓取文件内容。

内容的组织性

有些网站会根据文件上传者进行分类组织(比如新浪爱问),有些会根据文件内容所属领域进行分类(比如百度文库)。还有些网站会提供相关性推荐——列出下载该文件的网友同时也下载其它哪些文件。

总的来说,组织性中等。

内容的生命周期

被分享的文件,生命周期通常不会短。

内容的信噪比

信噪比因上传者而异,有的好有的差。

我的的使用场景

电子书是获取信息的主要途径之一,所以我经常会去网上找电子书。

通常是在搜索引擎中找某电子书(搜索书名),然后跳转到某文件共享网站,下载之。

如果文件共享类网站提供相关性推荐,偶尔也会根据“相关性”的推荐,下载另外的电子书。

顺便插播一个广告:

我在自己的网盘上收集了不少电子书,感兴趣的同学耐心等等,等我有时间会整理出来送给大家。

问答类

问答类是最近几年兴起的,国外的代表是“Quora”和“Stack Overflow”,国内是“知乎”。

内容的可搜索性

这类网站通常是"搜索引擎友好"的,甚至还会针对搜索引擎做优化(SEO)。因为这类网站需要利用搜索引擎帮它带来用户流量。

内容的组织性

通常会根据问题领域做分类,某些较好的问答类网站支持标签(Tag)功能。

总的来说,内容组织性较好

内容的生命周期

这类内容的生命周期,通常较长。

内容的信噪比

信噪比中上,至少比论坛好。

我的使用场景

因为我是搞技术的,通常是碰到某技术问题,在搜索引擎中找相关的关键字,然后跳转到某问答类网站的某话题。

如果觉得这篇文章没帮助,直接关掉。

如果觉得这篇文章有帮助,看完,关掉。

结尾

通过上述对比,你应该大致看出来,哪些类型的网站比较可能找到高价值的内容。

本系列的下一篇,介绍一下搜索引擎的基本技巧。

回到本系列的目录

本系列的目录

为了方便,把本系列的目录整理如下):

1.网站的类型和使用场景

2.Google 搜索的基本语法

3.解答 Google 搜索的常见问题(FAQ)

4. 搜索关键字有啥讲究

推荐阅读:

如何完善自己的知识结构

P2P高端骗局,最新玩法!

什么是「真正的」兴趣爱好?你想过吗?

提升认知,个人学习心得,体会,科技猎奇!

长按识别二维码关注


免责声明:本站所有内容及图片均采集来源于网络,并无商业使用,如若侵权请联系删除。

上一篇:如何设计不同类型网站?

下一篇:七大万能网站 可通用所有类型 大开眼界!

资讯 观察行业视觉,用专业的角度,讲出你们的心声。
MORE

I NEED TO BUILD WEBSITE

我需要建站

*请认真填写需求信息,我们会在24小时内与您取得联系。