一、大数据和传统数据存储的区别
没什么关联性 大数据是海量数据、是一种现状、一种解决问题的手段 传统数据存储是存储的问题
二、大数据时代需要学习哪些java知识
大数据时代需要学习数据的存储和处理技术。
大数据的存储主要是一些分布式文件系统,现在有好些分布式文件系统。比较火的就是GFS,HDFS前者是谷歌的内部使用的,后者是根据谷歌的相关论文用java开发的来源框架。hdfs可以学习。
然后就是数据处理是学mapreduce,这是大数据出的不错的实现,可以基于hdfs实现大数据处理和优化存储。
还有一个比较好的列式存储的数据库hbase,也是为了大数据儿生的非关系型数据库。
然后就是一些辅助工具框架,比如:hive,pig,zookeeper,sqoop,flum。
三、大数据可以解决的问题有哪些?
(1)以服务器为中心的传统的直接存储技术:DAS技术(Direct Attached Storage)。 DAS技术将通用服务器的一部分作为存储设备,该服务器同时提供数据的输入/输出及应用程序的运行。数据访问与操作系统、文件系统和服务程序是紧密相关的。目前,这种以服务器为中心的存储方式已不能适应越来越高的信息存储需求。但是,DAS产品的优势在于价格便宜,在那些数据容量不是很大和对数据安全性要求不是很高的部门还有一定的应用市场。 (2)以数据为中心的网络存储技术:NAS(Network Attached Storage)和SAN(Network Area Storage)。 NAS技术是一种特殊的利用专门的软、硬件构造的专用数据存储服务器,又有“瘦服务器”之称。它将分布的、独立的数据整合为大型集中化管理的数据中心。它将存储设备与服务器分离,单独作为一个文件服务器存在,去掉了通用服务器原有不适用的大多数计算功能,仅保留提供文件系统功能。可用于混合的UNIX/Windows NT局域网,不用购置价格昂贵的多功能服务器。相比较而言,它更适用于一个需要公共文件系统的服务器群,如电子邮件服务器组,Web服务器集群等。 (3)存储区域网(Storage Area Network,SAN)是一种将磁盘或磁带与相关服务器连接起来的高速专用网,采用可伸缩的网络拓扑结构,可以使用光纤通道连接,也可以使用IP协议将多台服务器和存储设备连接在一起。将数据存储管理集中在相对独立的存储区域网内,并可提供SAN内部任意节点之间的多路可选择数据交换。SAN独立于LAN之外,通过网关设备与LAN连接,是一个专门的网络。三个构成要素:网络互连结构、管理软件和存储系统。
四、java如何存储巨大的数字比如100!
存储100的阶乘,这种超大数字,java 还是提供了一些类的比如