All About Programming: my-life/what-big-data-brought.md at master ・ allwefantasy/my-life

my-life/what-big-data-brought.md at master ・ allwefantasy/my-life

一个公司如果开始要做大数据，成本是需要考虑的：

机器。会比传统的业务更消耗服务器，单机配置一般也比较高。
人员。BI,分析师，应用研发，架构，算法，每种类型的人价格都不便宜
数据为导向(或者慢慢转换为以数据为导向)会对原有的产品产生额外的负担。比如该产品需要产生大量的数据供大数据使用。

在实际的发展过程中，有很多老总敏锐的感觉到，手头有这么多有价值的数据，一定要利用起来，但是有几个问题确实是很多人不清楚的，大家也是边做边感受。有时候做到后面，心里也会犯嘀咕，花了这么多钱，这么多人手，做这件事情真的值得么？

我觉得真要做，至少要考虑下面几点：

需要多少成本？
需要多少时间？
产出是什么？
数据最后呈现的产品形态是什么？

如果能清楚的知道数据最后的产品呈现形态，想必产出也就自然而然知道了。毕竟产出需要特定产品去承载。

你知道了数据的最后的产品呈现形态，知道了产出，也就知道，数据究竟给公司带来了什么，也就回答了我们标题上的问题。

在罗列大数据都有哪些呈现形态的时候，我们不妨从一个非常高的角度看看大数据的组成包含哪些：

数据本身
流水线(支撑数据分析的数据处理平台)
挖掘加工(分析数据内部特征关联性规律,也就是机器学习)
产品(最终的呈现形态)

目前产品呈现形态，我所知的有：

推荐
- 电商应用最广泛。有效增加用户体验，同时提升点击转化购买率
- 有内容产出的站点。比如CSDN
- 做内容聚合的，比如今日头条。据说今日头条的算法随着用户使用的积累，效果越来越好了。
广告(精准营销)
- 专业的广告公司，比如广告联盟.
- 特定产品本身承载的广告投放。比如微信那个高大上的朋友圈广告
- 公司内部的EDM,电话，短信等营销
搜索(排序因子)
- 机器学习产生的很多中间结果可以有效的提升搜索的排序
用户分析(这算的上是一个中间产品，也算的上是一个最终产品)
- 了解你的客户是根本
- 金融行业非常依赖于此。比如信征，反作弊，反欺诈等。未来放贷的变革估计也靠此了。
- 这个可以作为一个直接的产品，也可以作为一个中间服务，直接支撑推荐，广告，搜索等产品
- 基于此还可可以有非常多的产品，就等待人们去挖掘了。
实时计算(流量计费，反欺诈/作弊等等都需要依赖于此)
BI报表
- 基础流量，你网站的pv,uv等等
- 质量监控，监控分析你的服务是否顺畅，比如视频播放卡顿比可以反馈出视频网站的服务质量。
- 运营监控，譬如通过情感分析可以得到用户的直观反馈。典型如京东评论的情感分析。
- 特定指标计算，这个是根据运营以及决策人员根据实际经验想看到的一些数据，我们把它量化，指标化，从而呈现出报表形态，方便运营以及决策人员做出相应的调整。
运维支持
- 也可以划归到BI报表中的质量监控中去
- 单独划归出来其实想说，大数据其实是可以对整个产品线的各个环节做support的。并不一定是我上面的列举。

上面说了七点，其实总结下，无非做了如下两件事情：

了解：

了解自己的产品
了解自己的用户

提升：

提升各种转化率
提升决策的准确率

当然，还有专门做数据的公司，只要他们能够为其他公司提供【了解】【提升】这两件事情，也就算达到自己的使命了。

Read full article from my-life/what-big-data-brought.md at master ・ allwefantasy/my-life

my-life/what-big-data-brought.md at master ・ allwefantasy/my-life

No comments:

Post a Comment

Labels

Popular Posts