阅读记录

第322章 有私心的苏小木[2/2页]

宿主脑阔疼 偷名

设置 ×

  • 阅读主题
  • 字体大小A-默认A+
  • 字体颜色
…等均已准备完成……”
      “……”
      张可接过话头,“今天,我们便启动大数据·算法、主导数据与行为模型课题。”
      张可的话语落下后,苏小木等人都没有太意外。
      这个大课题拖的时间挺长了。
      也是时候开始了。
      不过大家都有意无意的看了眼苏小木,心里都明白张可有很大概率是为了等苏小木完成a总决赛。
      没等大家开口,张可问道,“你们觉得,什么是大数据?”
      这个问题问出后,苏小木、谭凌、林唐等人都陷入了沉思。
      张可教授要听的肯定不是网络上的那些烂而化之的回答。
      而是他们每一个人自己的总结。
      从生活中、从学习中、从自身经历的方方面面进行总结归纳并给出答案……
      一般看来,大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
      是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
      从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分,必须采用分布式架构,必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
      同时大数据还需要特殊的技术,来有效处理大量的容忍经过时间内的数据。
      这些技术包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
      ib也曾提出了大数据的特点:大量、高速、多样、低价值密度、真实性。
      但,大家都不会简单的从这些概念上的东西来进行回答。
      良久。
      谭凌开口道,“我认为大数据就是数量庞大的任意数据,甚至这些数据本身并没有什么卵用,而且还没什么价值,扔之可惜。”
      “当然,大数据其实始终贯穿着人类的历史,从古至今的各种法例都能看到大数据的踪迹。”
      “比如连环案件分析?”林唐插嘴道。
      也不知道林唐是不是最近看柯南看多了,张口就是连环案件。
      其他几人各有回答。
      独剩下苏小木沉默不语。
      “小木同学,你来说说?”张可点了名。
      苏小木简单的答道,“说不好,我觉得大数据无非就是多维分析,最终针对的还是人。”
      “每个人都有每个人对大数据的理解,我们的课题只是从大数据出发,探索主导数据、行为模型的一个片段。”
      张可道。
      “大家可以通过课题,去找到每个人对大数据的新理解。”
      “硬件层面的准备基本完善,但软件层面的部署还得我们亲自来,首先是分布式文件系统,我们讨论一下,是否直接使用hadoo实现的分布式文件系统:hdfs?”
      张可的问题引发了课题实验组每个成员的意见发表。
      首先hdfs基本上是个通用的大数据分布式文件系统,最重要的一点是设计就是用来部署在低廉硬件上的。
      包括hadoo,完全就是为了大数据而开发的程序。
      hadoo框架最核心的设计就两点,hdfs和areduce。
      hdfs为海量数据提供了存储方式,areduce为海量数据提供了计算。
      苏小木试图争取了一下,“教授,如果我们课题的时间足够长的话,不如我们试试自己实现,不借用hadoo,重新设计分布式文件系统、并行运算算法、并行处理数据库这些。”
      “这样一来,专业针对的就是课题本身的算法、主导数据与行为模型。”
      苏小木的话是有道理的,当然也是有私心的……
      ======
      2更。

第322章 有私心的苏小木[2/2页]