第二十三章 数据-《永不下车》
第(3/3)页
这些讯息,在一般人眼中没有什么价值,但投放到地下市场的细分领域上,就会有人付费购买。
譬如说他自己,如果有人整理生命科学的文档,把某一个狭窄领域的相关信息筛选,组织起来,那么方然很乐意为此付费,事实上,相当于是花钱节约了时间。
一开始,方然还亲自动手做这种事,按照网站客户的需求,用简单的爬虫程序和嗅探器去搜罗数据,或者从其他黑客手中交换一些信息。
亲自入侵,这种事他还是很忌惮,所以只把整理好的材料发到指定的邮箱,每次得到几百马克。
但很快,他发现这样做费时费力,从时间的角度,得不偿失。
这是一个什么样的行业呢,“大数据“,名字听起来挺时髦,人类进入计算机时代已经有好几十年,计算机在社会中的应用越来越广泛,数据,信息化的基础之一,在世界各地的电脑和服务器里积累的越来越多。
这些长年积累的数据,是人类活动的忠实记录,也是一座价值未可估量的巨大宝藏。
不过,虽然IT领域已如此发达,数据的发掘和使用技术却一直滞后。
数据本身,只是存储器里的状态组合,组合本身没有价值,只有其中包含的信息被提炼出来,放到正确的地方使用,才有价值。
但这项工作,规模可想而知会是怎样的庞大。
按方然的观察,即便联邦的IT领域在全世界位居前列,数据的整合利用水平,却还处在很原始的初级阶段。
这样的大背景下,对数据整合处理的需求,是一个大有前途的领域。
第(3/3)页