在大数据时代,什么样的数据最具有挖掘价值?在信息安全问题频现的今天,如何才能安全地开放数据?如何才能保障社会中每一个人的商业安全?
在天眼查创始人兼ceo柳超博士看来,“私有数据的时代已经过去。未来,公开数据将以无限连接的方式,解决更加广泛的商业安全需求。”基于此,天眼查于2018年1月底上线了“商业头条”功能,通过数据挖掘和机器学习,推送用户所关注的、尚未关注的、有价值的商业信息。该新功能和原有的“查公司”、“查老板”、“查关系”的“商业查询”,形成了“商业信息获取闭环”,并实现从财经到科技,从国内到国外的500+媒体、1000+频道报道精选的全领域资讯覆盖。
在移动化和碎片化渐成趋势的当下,“商业头条”为用户定制个性化商业话题,提供多元化的信息获取方式。通过聚集实时滚动更新的优质商业新闻,来实现天眼查从“搜索引擎”到“推荐引擎”的“商业信息获取闭环”,一站式满足用户所需商业信息,这也是天眼查在“商业安全”上的重大布局。
数据的价值在于链接
2016年,天眼查产品刚刚上线,那也是大数据产业发展最为艰难的时候。在当时看来,公开数据没有任何访问壁垒,可以随意抓取。因此在资本市场的眼中,私有数据比公开数据的价值更为明显,这导致当时“买卖私有数据”的现象频发,整个大数据产业的“竞技场”凹凸不平。
随着“促进大数据发展”以及“政府信息公开”两个关键性条文的明确提出,柳超明显感觉到市场安静了,开始变得合法合规。也是从那一刻起,大家的视线才开始转移向“公开数据”。
为什么说公开数据是非常有价值的?在天眼查柳超看来,“数据的价值在于链接,然而私有数据是存在数据孤岛的,只有公开数据才能规避这一问题,并通过链接、挖掘来产生更高的用户价值。”
柳超打了一个比方,“就好像一块木头疙瘩只值10块钱,但经过雕刻、加工、包装最终变成工艺品后,可能卖到10万、100万、1000万。大数据也是一样,放在硬盘、excel具有的只有体表价值,但当它经过数据动作,清洗之后就创造了展示价值,可以画饼状图,出报表。”简言之,就是经过不同的加工,从低价值变为高价值。
然而想要通过加工,将数据变成关系图谱并不容易,理论上这是一个无解的问题。柳超解释说,“现在大家用的数据库是关系型数据库,研究者证明关系型数据库是满足acid理论的,只要满足这个理论就意味着关系型数据库是完备的,它可以用来表述所有的商业模式,但最大的问题就是不够直观;图数据库虽然很直观,但研究者已经证明它是不可能实现acid理论的。”
因此,天眼查团队只能试图在特定行业对图数据库进行快速优化,试图以“关系图谱”为入口,解决用户“快速寻找关系”的这一痛点。
开放不仅是一种态度,更是一种能力
自1883年,柯克霍夫原则提出——安全,必须通过透明、公开来保证,而不能通过隐匿来实现。无论是在密码学领域、软件领域,还是现在热火的区块链领域,都是因为开放才安全,“正是因为开放,所以大家才信任它。”柳超说。
2013年9月16日,腾讯总裁刘炽平宣布,腾讯将搜索业务连人带机器、流量、入口一块打包给搜狗。当时,柳超也作为资产的一部分,进入搜狗,“那是我第一次被卖”,柳超打趣着说,“当天宣布完这个事我特别乐呵,感觉非常有幸能够见到腾讯这么大公司,通过战略开放合作把自己卖给其他公司。”
“开放不仅是一种态度,更是一种能力。”这句话,马化腾曾在腾讯的管理会议上提过多次,而对于当时的柳超来说,这真的只是一句话而已。
直到2016年天眼查app上线,柳超才对这句话的理解愈发深刻。当时的天眼查是一个无需注册、登录、没有验证码的开放式网络系统,相应的,天眼查收获了由开放带来的好处——使用方便、传播快,但与此同时,“我们也面临很大的被抓取压力,所以就必须开发很强的反抓取算法,来对抗这种恶意抓取。”
一路走来,天眼查在不断加强自身反抓取能力的同时,也在坚守开放的态度。也正是这种开放的战略与心态,使得天眼查从“企业查询”的简单功能,逐步升级为 “关系图谱”,从“商业调查工具”演化为“商业安全工具”,旨在“用公开数据,以开放的方式,解决广泛的商业安全需求”,实现“让每个人公平地看清这个世界”的使命。