-
实时大数据处理Storm(一)
所属栏目:[大数据] 日期:2021-01-25 热度:171
自从Google发表了3篇举世瞩目的论文(Google File System、BigTable和MapReduce)以后,大数据被引爆了。如果说计算机的威力相当于一枚大炮的威力的话,那么互联网的威力相当于一颗原子弹,而大数据的威力则相当于氢弹,大数据成为了IT发展史上的又一次浪潮[详细]
-
ZZNU 1988 (大数取余)
所属栏目:[大数据] 日期:2021-01-25 热度:84
1988: Sn 时间限制: 1 Sec?? 内存限制: 128 MB 提交: 19?? 解决: 8 [提交][状态] 题目描述 给你两个数 n,p(0 n,p = 10^15); a1 = 1;? a2 = 1+2;? a3 = 1+2+3;? ... an = 1+2+3+...+n? Sn = a1+a2+a3+...+an; 求(6*Sn) % p; 输入 ?输入一个数 T表示有T组实例;[详细]
-
HDU 5351 MZL#39;s Border(大数 + 找规律)——2015 Multi-Uni
所属栏目:[大数据] 日期:2021-01-25 热度:78
传送门 MZL’s Border Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 65536/65536 K (Java/Others) Total Submission(s): 1374????Accepted Submission(s): 452 Problem Description As is known to all,MZL is an extraordinarily lovely girl.[详细]
-
哈佛商评 :使用大数据为消费者创造价值
所属栏目:[大数据] 日期:2021-01-25 热度:113
大数据为市场提供大的保证。显而易见,大数据自推出以来就回答以下两个阻碍市场发展的最烦人的问题: 1)谁买,买什么,什么时候买,什么价位买?2)是否能将消费者所听,所知,所看的东西和他们所购买和所消费的东西联系起来? 通过提高目标市场和鉴别、排[详细]
-
大数据分析平台架构(Big Data Analytics Platform)
所属栏目:[大数据] 日期:2021-01-25 热度:83
一、数据分析平台层次解析 ? 大数据分析处理架构图 数据源: ?除该种方法之外,还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构,而特别要说的是流数据,它的核心就是数据的连续性和快速分析性; 计算层: ?内存计[详细]
-
开源大数据查询分析引擎现状
所属栏目:[大数据] 日期:2021-01-25 热度:141
文|叶蓬 【按:此文是与我的《基于大数据分析的安全管理平台技术研究及应用》同期发表在内刊上的我的同事们的作品,转载于此。这些基础性的研究和测试对比分析,对于我们的BDSA技术路线选定大有帮助。】 引言 大数据查询分析是云计算中核心问题之一,自从Goo[详细]
-
多数组K大数
所属栏目:[大数据] 日期:2021-01-23 热度:76
题目描述 给定两个有序数组arr1和arr2,在给定一个整数k,返回两个数组的所有数中第K小的数。 例如: arr1 = {1,2,3,4,5}; arr2 = {3,5}; K = 1; 因为1为所有数中最小的,所以返回1; arr1 = {1,3}; arr2 = {3,5,6}; K = 4; 因为3为所有数中第4小的数,所以[详细]
-
ETL是BI(商业智能)的基础,调度是ETL的灵魂
所属栏目:[大数据] 日期:2021-01-23 热度:79
ETL是数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程 你想啊,数据的由来都是ETL实现的,以后所有的数据处理,不都是要依靠这些抽取来的数据。这一块没有做好,后面的分析,展现就是来了大神,他也没有办法,就像巧妇难为无[详细]
-
uva 1639 Candy 大数的对数处理 数学期望
所属栏目:[大数据] 日期:2021-01-23 热度:65
当排列组合数或者幂很大时可以利用对数计算,之后再用exp还原,保证一定的精度。 数学期望是每一个可能的值和相应的概率的乘积和,没有可能值可以设。 仔细读题,吃完最后一个糖果后不知道是否已经吃完,所以需要再选一次。 %f用来输入float,输出float doubl[详细]
-
【BZOJ4542】大数, 莫队
所属栏目:[大数据] 日期:2021-01-23 热度:128
Time:2016.09.10 Author:xiaoyimi 转载注明出处谢谢 传送门 思路: 神奇的东西 断断续续地想了一天没搞出来 因为没想到离散化(╯‵□′)╯︵┻━┻ 有一个有趣的性质 定义 T i = ∑ n j = i s [ i ] ? 10 n ? j + 1 ( m o d P ) s[i]是原字符串中第i个位置的[详细]
-
R语言与金融大数据处理——基础篇(代码)
所属栏目:[大数据] 日期:2021-01-23 热度:170
# 加百力咨询: 《R语言与金融大数据处理》 - 《基础篇》 (v1.0) # 最后修改时间:2014-04-23(17.3) # 加百力咨询: 《R语言与金融大数据处理》 - 《基础篇》 (v1.0) # 主讲人:加百力 ### 01、课程介绍 ### ###### ###### ###### ###### ###### ###### ##[详细]
-
大数据,为什么不是传统BI的简单升级?
所属栏目:[大数据] 日期:2021-01-23 热度:116
本文作者 傅一平,首发于公众号 与数据同行 (ID:ysjtx_fyp),由作者授权 大数据 转载。如需转载请与作者联系,谢绝二次转载。 BI(BusinessIntelligence)即商务智能 ,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报[详细]
-
?干货|一文读懂Power BI
所属栏目:[大数据] 日期:2021-01-23 热度:165
作者:哥本哈士奇 伴随着数据量的日益增长,通过自服务式的商业智能把数据转换成辅助决策支持的工具,越来越成为迫切的需求。在以前,处理这些数据往往只是IT人员范围内的事,但是通过Power BI for Office 365里面的新功能喝服务,微软降低了这个门槛。它里[详细]
-
访问日志的大数据分析应用
所属栏目:[大数据] 日期:2021-01-23 热度:58
本文整理自APMCon 2016中国应用性能管理大会CDN加速专场又拍云CTO黄慧攀题为《访问日志的大数据分析应用》的演讲,现场解读了在海量访问日志中提炼多个性能指标,对日志分析系统查询需求进行分析,对访问特点进行分析,并基于性能考虑对系统架构进行优化,从[详细]
-
大数据时代:传统BI还能走多远?
所属栏目:[大数据] 日期:2021-01-23 热度:106
div class="iteye-blog-content-contain" style="font-size: 14px;"? 从事BI多年,经历了经营分析系统的大建设,大发展时期,也有幸处在大数据与传统BI系统的交替之际,因此特别来谈谈,传统BI还能走多远? img src="http://p1.pstatp.com/large/e4900012f67[详细]
-
【华为练习题】大数阶乘
所属栏目:[大数据] 日期:2021-01-23 热度:157
【华为练习题】大数阶乘 题目 计算阶乘n!是一件可怕的事情,因为当n并不是很大时,n!将是一个很大的值。例如13! = 6227020800,已经超过了我们常用的unsigned int类型的取值范围。请设计一个程序,使其可以计算100以内的数的阶乘,结果用字符串的形式输出 解[详细]
-
大数取余数-----x的y次方取余数
所属栏目:[大数据] 日期:2021-01-23 热度:159
大数取余数--- 题目描述: 输入一个位数不超过10^6的整数a,求a%5并输出 //此题肯定不能用long,int表示要输入的这个整数,这两种类型表示的范围没有题目要求的那么大;可用string #includeiostream#includestringusing namespace std;int main(){string str[详细]
-
美业B2B龙头博卡:美业大数据价值挖掘才刚刚开始 | 互联网+案例
所属栏目:[大数据] 日期:2021-01-23 热度:198
作为一个立足美业十二年的软件提供商,博卡目前全国市场份额超50%,平台年交易流水约1500亿元。创始人吴新明在谈到当下美业面临的痛点和呼声时认为,由于自身特征,美业彻底革命并非易事,通过帮助经营者进行自我改良或许更合适。 2004年成立的美业软件服务[详细]
-
hdu 1023Catalan出栈方案+大数
所属栏目:[大数据] 日期:2021-01-21 热度:183
点击打开链接 Catalan //入栈顺序递增1...n 求出栈方式有多少种 //对编号1进行分类 编号1为出栈序列的第k个元素 //则方案为f(k-1)*f(n-k) k从1累加到n,母函数求递推公式得到 f[n]=f(n-1)*(4n-2)/(n+1)? #include iostream#include cstdio#include cstring#in[详细]
-
视频时代,谁更能理解数据处理的需求?
所属栏目:[大数据] 日期:2021-01-21 热度:184
根据《2016 互联网文化娱乐产业洞察》显示,2016 年上半年文创行业共有 196 家创业公司获得融资,其中影视类占比 30%,视频直播类占比 21%,动漫类企业占比 16%,以上 67%的创业企业均为视频相关创业者。2016 年成为视频创业爆发年。 (一)我们常在说时代,[详细]
-
【Java常用类库】_大数操作(BigIntger、BigDecimal)
所属栏目:[大数据] 日期:2021-01-21 热度:166
Ref: http://www.voidcn.com/article/p-cjboaawb-g.html 本章目标: 可以使用 BigInteger操作大整数 大数据操作。正常情况下一个整数只能放在long类型之中,但是如果现在有如下的一个数字: 22222222222222222222222222222222222222222222222222222222222222[详细]
-
R语言数据处理方法~小结
所属栏目:[大数据] 日期:2021-01-21 热度:179
文章目录 1. R自带函数 2. reshape2数据重构 3. dplyr 4. tidyr 5. 字符串处理 1. R自带函数 1.1 转置 使用函数t()可对一个矩阵或数据框进行转置,对于数据框,行名将变成变量(列)名。 数列array进行维度转换 aperm 1.2 整合数据aggregate 在R中使用一个或[详细]
-
nyoj28 大数阶乘
所属栏目:[大数据] 日期:2021-01-21 热度:94
nyoj24 大数阶乘 链接:http://acm.nyist.net/JudgeOnline/problem.php?pid=28 正确代码: #includestdio.h#includestring.h#includestdlib.h#includemath.h#includealgorithmusing namespace std;const int maxn=40000;int a[maxn]={0};int main(){ int m,i[详细]
-
[转]文本相似性算法:simhash/minhash/余弦算法
所属栏目:[大数据] 日期:2021-01-21 热度:78
数据挖掘之lsh(局部敏感hash) minhash、simhash 在项目中碰到这样的问题: 互联网用户每天会访问很多的网页,假设两个用户访问过相同的网页,说明两个用户相似,相同的网页越多,用户相似度越高,这就是典型的CF中的user-based推荐算法。 算法的原理很简单[详细]
-
[转]TF-IDF与余弦相似性的应用
所属栏目:[大数据] 日期:2021-01-21 热度:147
TF-IDF与余弦相似性的应用(一):自动提取关键词 作者:?阮一峰 日期:?2013年3月15日 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预[详细]