about云开发

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 4964|回复: 1

[每日一读汇总] 注册免费送体验金平台

[复制链接]

821

主题

135

听众

140

收听

管理员

Rank: 9Rank: 9Rank: 9

积分
14067
发表于 2018-11-1 07:29:23 | 显示全部楼层 |阅读模式

about云每日一读汇总(第一篇)

about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)

about云每日一读汇总(第五篇2015.01.01)

about云每日一读汇总(第六篇2015.02.01)

about云每日一读汇总(第七篇2015.03.01)

about云每日一读汇总(第八篇2015.05.01)

about云每日一读汇总(第九篇2015.06.21)

about云每日一读汇总(第十篇2015.09.01)

about云每日一读汇总(第十一篇2015.11.14)

about云每日一读汇总(第十二篇2016.01.01)

about云每日一读汇总(第十三篇2016.04.01)

about云每日一读汇总(第十四篇2016.05.16)

about云每日一读汇总(第十五篇2016.07.18)

about云每日一读汇总(第十六篇2016.10.18)

about云每日一读汇总(第十七篇2016.12.05)

about云每日一读汇总(第十八篇2017.01.05)

about云每日一读汇总(第19篇2017.03.24)

about云每日一读汇总(第20篇2017.06.01)

about云每日一读汇总(第21篇2017.08.01)

about云每日一读汇总(第22篇2017.09.30)

about云每日一读汇总(第23篇2017.12.08)

about云每日一读汇总(第24篇2018.01.02)

about云每日一读汇总(第25篇2018.03.21)

about云每日一读汇总(第26篇2018.05.01)

about云每日一读汇总(第27篇2018.07.02)


about云每日一读汇总(第28篇2018.09.03)

关注最新经典文章,欢迎关注公众号

about云2018年12月29日每日一读


Spark 高级分析:第十章第3节 Parquet格式与列式存储
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26548
1.什么是Parquet
2.Parquet底层原理是什么

3.
如何定义使用谓词类



文档:
Hadoop性能调优与运维
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26551


HDP2.3安装文档
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26552




about云2018年12月28日每日一读


彻底明白Flink系统学习16:【Flink1.7】DataSet 编程之Data Sinks详解
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26546
1.DataSet 有哪些内置Sink?
2.Flink Sink的作用是什么?
3.DataSet 输出数据如何实现本地排序?
4.Sink是否支持全局排序?


文档:
大数据行业商业模式与建模2018-12-25
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26544


应用预测建模中文
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26545





about云2018年12月27日每日一读


彻底明白Flink系统学习15:【Flink1.7】DataSet 编程之Data Sources详解
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26540
1.Flink如何获取各种不同格式的文件,转换为dataset?
2.Flink sources有哪些类型?
3.Flink是否可以读取压缩文件?
4.Flink读取压缩文件有什么缺点?
5.Flink如何遍历读取目录中的文件?



文档:
ClickHouse多文档汇总:迁移到ClickHouse实用指南等
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26541


书籍:
程序员的数学 2 概率 ,平冈和幸,(日)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26538




about云2018年12月26日每日一读


安装配置:
一步步实践在Redhat7.4系统安装CDH6.1 Hadoop集群
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26534
1、集群安全前置准备有哪些?
2、如何安装外部数据MySQL?
3、如何安装Cloudera Manager?
4、如何安装CDH集群?


书籍:
Kubernetes实战
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26536

大数据算法.王宏志(详细书签)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26535




about云2018年12月25日每日一读


彻底明白Flink系统学习14:【Flink1.7】DataSet 编程之Transformations详解
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26531
1.DataSet与 Datastream Transformations 都有哪些API?
2.DataSet MapPartition的作用是什么?
3.ReduceGroup与Reduce有什么区别?
4.Join Hints是什么?
5.Flink是否所有外部联接类型都支持所有执行策略?
6.CoGroup与join的区别是什么?
7.Cross使用需要注意什么?
8.Range-Partition可以解决什么问题?


Flink中cogroup, join和coflatmap比较
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26532
1.Flink 双数据流转换为单数据流操作有哪些?
2.cogroup, join和coflatmap各自完成什么事情?
3.cogroup, join和coflatmap区别是什么?



文档:
注册送体验金官网链的应用【2018年11月】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26530


书籍:
机器视觉【王亮、蒋欣蓝】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26529


疑问解答:
hive decode函数使用例子给一个?
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26528





about云2018年12月24日每日一读


Spark 高级分析:第十章第2节用ADAM CLI摄取基因组学数据
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26522
1.什么是ADAM
2.如何使用ADAM

3.
如何分析结果



CDH6.1 版本发布:新功能详细介绍
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26524
1.CDH6.1有哪些新功能?
2.CDH免费版限制多少个节点?
3.CDH6.1有哪些细粒度权限?



书籍:
动手学深度学习
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26525


spark优化详解
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26526




about云2018年12月21日每日一读


彻底明白Hadoop map和reduce的个数决定因素【白话】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26518
1.Hadoop 设置map的个数后为什么不生效?
2.map的个数有什么来决定?
3.如何确定分片的大小?
4.reduce个数该如何设置?
5.reduce个数由什么来决定?



文档:
Hive优化
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26516


书籍:
Hadoop大数据处理 (刘军著)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26517





about云2018年12月20日每日一读


彻底明白Flink系统学习13:【Flink1.7】流连接器介绍及如何添加连接器
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26512
1.Flink有哪些内置连接器?
2.Flink二进制发布包中是否直接可以使用连接器?
3.如何才能添加连接器?
4.连接器使用有那两种方式添加?
5.连接器添加jar包的方式,如何才能生效?


文档:
共享单车服务系统研究与大数据处理【吕丹】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26514


hive微博项目及解析
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26513




about云2018年12月19日每日一读


阿里AnalyticDB数据仓库实现海量数据实时分析
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26503
1、AnalyticDB整体架构有哪些组件?
2、AnalyticDB有哪些核心技术?
3、玄武存储引擎有哪些优点?
4、羲和计算引擎是什么?



文档:
阿里巴巴大牛讲解技术汇总【七文档】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26508


机器学习注册送体验金无需申请教程【价值50块钱】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26507


问答:
flume1.8是否可以监听的同时打印此时监听的精准时间
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26505


方案探讨:
Yarn配置:如何指定物理CPU核心数
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26504





about云2018年12月18日每日一读


彻底明白Flink系统学习12:【Flink1.7】如何控制流物理分区
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26497
1.如何实现Flink流分区?
2.对于数据倾斜,该使用什么函数实现数据均衡?
3.Rescaling与rebalance有什么区别?



如何利用业余时间,掌握数据分析硬技能【课程】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26498


文档:
HBase性能优化方法总结
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26500

某集团大数据平台整体方案建议书
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26499




about云2018年12月17日每日一读


连载:
Spark 高级分析:第十章第1节 解耦存储与建模
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26490
1.本章主要目的有哪些
2.
什么是Avro
3.
现有的RPC框架有哪些?有何异同?



职业指导:
三大思维成就优秀工程师,你具备哪些?
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26493


书籍:
Python数据科学导论  概念、技术与应用
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26494


文档:
大数据平台运维架构实践
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26495





about云2018年12月14日每日一读

连载型:
彻底明白Flink系统学习11:【Flink1.7】事件时间、处理时间、提取时间有什么区别
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26488
1.事件时间、处理时间、提取时间的顺序是什么?
2.事件时间为何需要水印?
3.处理时间是否提取的当前系统的时间?
4.数据到达Flink的时间是什么时间?


书籍:
大数据架构详解:从数据获取到深度学习
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26486


深入理解Java虚拟机_JVM高级特性与最佳实践 第2版
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26485




about云2018年12月13日每日一读


连载:
彻底明白Flink系统学习10:窗口生命周期、Keyed和非Keyed及分配器诠释
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26483
1.窗口是什么时候开始创建的?
2.窗口删除是什么时候?
3.如何延迟窗口删除?
4.Keyed和Non-Keyed Windows有什么不同?
5.在所有的窗口中,哪一个窗口是不基于时间的?


领取100本书+1T资源
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26480


文档:
亿级大数据实时分析之旅
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26481


书籍:
深入理解OpenStack Neutron
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26482






about云2018年12月12日每日一读


连载型:
TensorFlow ML cookbook 第六章2、3节 运行门和激活功能、实现单层神经网络
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26476
1、如何创建两个具有相同结构的单层神经网络?
2、如何声明两个模型参数?
3、如何设置迭代次数和激活函数?
4、如何理解完全连接的神经网络?




文档:
HBaseRowKey与索引设计
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26473


Hive数据仓库全流程开发
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26474


组件下载:
springboot mybatis phoenix链接测试
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26477


疑问解答:
flume1.8是否可以解决多级目录检索
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26472






about云2018年12月11日每日一读


彻底明白Flink系统学习9:【Flink1.7编程】数据流Transformations介绍2窗口及相关操作
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26469
1.为何产生window窗口计算?
2.你认为什么情况下使用Window Apply?
3.Window Fold可以用来做什么?
4.window 流是否可以union和join?
5.DataStream是否可以split?



书籍:
拥抱大数据新常态下的数据分析典型案例 [李倩青,王震 著] 2015年版
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26467


Elasticsearch技术解析与实战-高清版
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26466




about云2018年12月10日每日一读


连载型:
Spark 高级分析:第九章第10,11节 返回值分布可视化和结果评估
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26457
1.如何将返回结果可视化
2.
如何对结果进行评估
3.
蒙特卡洛风险模拟可以用来做什么




使用SQL Developer客户端访问Kerberos环境下的Hive
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26459
1.怎样安装Kerberos客户端?
2.怎样用LDAP方式访问Hive?
3.怎样用Kerberos方式访问Hive?
文档:
Hive权限设置说明文档
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26462
神经网络与深度学习
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26463






about云2018年12月07日每日一读


机器学习逻辑回归详解
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26452
1.什么是逻辑回归?
2.如何处理因变量取值离散的情况?
3.如何求解w、b?
4.逻辑回归有哪些用途?


实践型:
计算订单明细中那些组合商品更受欢迎
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26451


小知识点:
什么是DAPP
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26453



文档:
阿里巴巴java开发手册
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26455


书籍:
Hadoop数据仓库实践
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26454







about云2018年12月06日每日一读


连载:
彻底明白Flink系统学习8:【Flink1.7编程注册送体验金无需申请】DataStream Transformations介绍
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26445
1.Flink中Map函数和FlatMap函数有什么区别?
2.如何生成KeyedStream?
3.KeyedStream如何转换为DataStream ?
4.min和minBy之间的差异是什么?


疑问解答:
Spark2.3/2.4可以直接使用hive2/3的元数据吗,是否需要重新编译
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26442


impala不用rpm如何安装
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26449



文档:
Windows-10-编译-hadoop详细步骤
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26446


Flink实践
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26447


注册送体验金官网链3.0共识蓝皮书
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26448





about云2018年12月05日每日一读


论实时推荐算法在阿里百亿特征上的应用
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26439
1、弹性改造及优势有哪些?
2、如何进行离线训练优化?
3、如何理解特征动态增删技术?
4、如何理解模型压缩和稳定性?




名企资源:
华为大数据介绍-江苏
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26438


文档:
CDH开启Kerberos+Sentry权限控制-实施配置指南
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26437




about云2018年12月04日每日一读


彻底明白Flink系统学习7:【最新基于Flink1.7】使用DataStream API进行数据处理
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26434
1.流处理和批处理分别入口是什么?
2.对于本地和远程运行程序,都可以使用哪个函数?
3.Flink数据源分为哪两类?
4.Flink DataStream和DataSet source都是基于什么格式?
5.Flink中kafka source是否为自定义?

书籍:
spark权威指南(基于spark 2)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26432

文档:
注册送体验金官网链知识 - 智能合约(普及篇)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26431

疑问解答:
cdh hbase经常报告slow read
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26430

异常错误:
dashboard无法删除云主机,指令也删不掉
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26429




about云2018年12月03日每日一读


版本说明:
Flink1.7稳定版本发布:新增功能介绍
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26424
1.Flink1.7开始支持Scala哪个版本?
2.Flink1.7状态演变在实际生产中有什么好处?
3.Streaming SQL支持MATCH_RECOGNIZE有什么好处?
4.支持Flink SQL / Table API中的富集连接可以做那些事情?
5.Flink1.7新增了哪些连接器?


实操演练:
DBeaver实战之访问Kerberos环境下的Hive
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26425
1.如何使用DBeaver访问Kerberos环境下的Hive?
2.怎样配置Kerberos环境变量?
3.怎样配置DBeaver?



连载:
Spark 高级分析:第九章第8,9节 多元正态分布和试验
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26422
1.什么是多元正态分布
2.
将多元正态分布拟合到我们的数据中需要做什么
3.如何进行数据试验



文档:
阿里双十一技术
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26427


书籍:
大数据Spark企业级实战版【813页】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26426




about云2018年11月30日每日一读


总结型:
HIVE生产环境优化措施总结
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26420
1.如何开启Fetch?
2.哪些情况下,hive执行不使用MapReduce?
3.本地模式适用于什么情况?
4.小表与大表新版本是否需要优化?
5.大表与大表空值比较多该如何优化?
6.如何在Map端join?
7.动态分区的作用是什么?
8.数据倾斜有哪些措施?
9.严格模式你认为什么情况下会用到?

实践型:
RPM命令失效该如何解决
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26419

名企资源:
华为金融大数据解决方案汇报V2.0
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26418

文档:
ClickHouse中文文档【334页】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26417

异常错误:
mapreduce执行自带的wordcount例子报错
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26415






about云2018年11月29日每日一读

彻底明白Flink系统学习6:Flink最全最详细集群安装【带有各种说明】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26396
1.ssh安装需要注意什么问题?
2.Flink集群配置文件是哪个?
3.Flink常用配置参数的含义是什么?
4.如何具体配置某个taskmanager的内存?
5.如何指定taskmanager?
6.如何指定nodemanager?
7.如何启动集群?


实操演练:
应用shell脚本处理hadoop中FsImage小文件
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26405
1、Hadoop集群大量小文件对集群造成什么影响?
2、如何使用hdfs oiv命令解析FsImage文件?
3、如何使用FsImage分析脚本处理小文件?
4、如何使用Sqoop抽取MySQL中Hive元数据表数据到Hive?


实践型:
虚拟机VMware12中Linux(centos7)网卡地址相同遇到问题总结
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26409



书籍资源:
Java 核心技术 第10版(卷一中文版+英文版)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26406


Java 核心技术 第10版高级特性(卷II中文版+英文版)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26407


疑问解答:
求助,zeppelin 数据查询异常
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26410


异常错误:
sqoop导入数据问题求助
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26411




about云2018年11月27日每日一读


彻底明白Flink系统学习5:window、Linux本地安装Flink
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26393
1.如何在window下安装Flink?
2.Flink本地安装启动命令与原先版本有什么区别?
3.window和Linux本地启动命令有什么区别?

4.如何查看Flink web ui?


集群安装准备工作:Hadoop、Spark、Flink等
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26395
1.网络配置你认为集群是否都需要?
2.为何集群安装都需要配置ssh?
3.java为何 要安装?


书籍:
趣学算法【孙小玉】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26397




about云2018年11月26日每日一读

实操演练:
通过实践验证HDFS纠删码的机架感知策略
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26389
1.什么情况下不建议对小文件使用纠删码策略?
2.怎样进行机架容错?
3.如何根据文件大小以及纠删码策略计算block group数量以及每个block的大小?

连载:
Spark 高级分析:第九章第6,7节 权重因子的确定和数据抽样
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26386
1.如何确定权重因子
2.如何拟合线性模型?

3.如何进行数据抽样



书籍:
程序员健康指南
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26391


Bloom Filter文档汇总【算法】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26390




about云2018年11月23日每日一读


彻底明白Flink系统学习4:功能点介绍
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26377
1.为什么说Flink是高性能?
2.什么是Flink状态计算?
3.Flink如何实现容错的?
4.Flink为何要内存管理?
5.Flink中流处理和批处理的关系是什么?

OpenCV 4.0正式发布!
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26373
1.学习OpenCV是从新版本学习,还是从旧版本学习?
2.OpenCV优化了持久层,可以做哪些事情?
3.OpenCV介绍了哪些新特性?
4.OpenCV有哪些新模块?

外站经典:
Flink实战教程
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26378


文档:
CDH集群安装部署运维手册
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26380


Flink文档【sql、IO、事件时间处理和Watermarks】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26379



异常错误:
已经一周勒,网上看帖子都没能解决,求大神指点
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26382


疑问解答:
hive查询结果完成后,am一直running
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26381

hive on spark 的资源调度问题
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26375

方案探讨
MapReduce里面自定义的InputFormat重写isSplitable()
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26376




about云2018年11月22日每日一读


彻底明白Flink系统学习3:编程知识之Flink程序结构
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26371
1.Flink程序结是什么结构?
2.Flink中source,sink分别是什么意思?
2.Flink数据源有哪些?
3.如何自定义Flink数据源?
4.Flink如何定义Sink?


书籍:
Hadoop应用架构
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26368


面试题汇总:
大数据面试题汇总
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26367




about云2018年11月21日每日一读


连载:
TensorFlow ML cookbook 第六章1节 神经网络-实施操作入门
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26359
1、什么是神经网络?
2、什么是神经网络重要的特性?
3、如何实现简单的神经网络?
4、优化算法如何声明为标准梯度下降?



书籍:
Redis开发与运维(完整版)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26363


组件下载:
win10系统编译好的hadoop源码【Hadoop2.7.1】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26364


异常错误:
secure DataNode无法启动
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26361




about云2018年11月20日每日一读


彻底明白Flink系统学习2:Flink分布式执行包括调度、通信机制、检查点等
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26357
1.Flink提交到运行程序涉及哪些进程?
2.Flink slot是什么?
3.Job客户端是不是Flink内部部分,它的作用是什么?
4.Flink通信机制是什么?
5.Actor系统包含哪些内容?


书籍:
Spark内核设计的艺术:架构设计与实现【完整版】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26358


其它:
【连载】深度学习笔记14:CNN经典论文研读之Le-Net5及其Tensorflow实现
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26354




about云2018年11月19日每日一读


Scala实战之访问Kerberos环境的HDFS
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26348
1.如何使用Scala代码访问Kerberos环境的HDFS?
2.怎样导出Kerberos集群中访问HDFS的keytab文件?
3.怎样实现客户端访问HDFS工具类?

企业为什么选择使用Cloudera Manager
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26350

Cloudera实战课程介绍
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26351

文档:
提高Flink易用性【 阿里 砚田2018.11最新2文档】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26352




about云2018年11月16日每日一读


彻底明白Flink系统学习1:Flink介绍
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26343
1.Flink有哪三种运行模式?
2.Flink架构有几层?
3.Flink每层的作用是什么?
4.JobGraph是什么?
5.executiongraph是什么?


书籍:
相关性搜索:利用Solr与Elasticsearch创建智能应用
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26345


文档:
【 汇智 谭杰河】汇智在Flink上的实践【2018.11最新文档】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26344





about云2018年11月15日每日一读


Hbase 通过行键rowkey实现多区间查询
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26336
1.hbase的rowkey本文是如何设计的?
2.字符串是采用什么方式存储到rowkey中的?
3.模板数字的作用是什么?
4.什么是与运算?


文档:
Flink在袋鼠云一站式大数据平台中的使用【 2018.11最新文档】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26338


学习pyspark【书籍】:版本spark2.0
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26337


方案探讨:
电商中最佳商品组合计算
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26340




about云2018年11月14日每日一读

Kerberos CDH集群不同OS版本配置HDFS的Gateway节点
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26334
1、如何进行时钟同步?
2、如何安装Kerberos客户端?
3、Kerberos如何进行客户端功能验证?
4、如何处理RedHat6.6 客户端异常问题?


英文资料:
使用Python应用深度学习【书籍】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26332


资源下载:
Hadoop面试题系列4:Java面试
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26331




about云2018年11月12日每日一读

Spark2.4.0发布
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26319

Spark 高级分析:第九章第5节 数据预处理
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26315
1.预处理的数据数据格式是怎样的
2.哪些数据需要预处理?做怎样的处理?

3.预处理代码如何编写的


CDH集群高可用之在Kerberos环境下修改HOSTNAME
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26320
1.怎样配置环境及停止集群服务?
2.怎样修改集群HOSTNAME及集群服务配置?
3.怎样做功能验证?

视频:
Go语言三大套视频
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26317

Elasticsearch.权威指南(中文版)
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26323


Hadoop面试题系列3:大数据面试题
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26322

问答:
求一个大数据相关项目idea 作为毕业设计
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26318





about云2018年11月09日每日一读

Flink SQL详解及小案例应用:如何定义、使用及实践
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26308
1.为何会有Flink SQL?
2.本文哪些地方涉及Flink 1.7?
4.如何定义源(sources )和接收器(sinks)?
5.Flink SQL本文介绍了哪些sql?
6.将数据格式化为正确的格式以便进一步处理?
7.如何监控Flink sql查询
8.使用Flink SQL中的视图的作用是什么?
9.本文使用Flink sql实现了什么案例?


如何应对“智力型”的算法面试题?
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26313


英文资料:
Flink sql入门三大新文档【2018】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26311


资料下载:
Hadoop面试题系列2:Hadoop就业面试宝典
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26310


39天大数据学习汇总
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26309


异常错误:
SparkStreaming 消费kafka数据异常
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26312


Hue测试连接出现找不到altscript.sh
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26307








about云2018年11月08日每日一读

解说解说:
Apache Flink中Savepoints和Checkpoints之间的3个区别
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26299
1.Savepoints和Checkpoints是什么?
2.Savepoints和Checkpoints有哪三点区别?
3.何时在流应用程序中使用Savepoints?



文档:
39天大数据学习第39天:资料补充
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26301


下载:
Hadoop面试题系列1:各个公司就业面试宝典
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26304


面试题:
大数据面试题【无答案】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26302


大数据面试题【有答案】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26303


疑问解答:
MapReduce 从本地提交到集群 ,代码中不设置jar包位置,跑的时候就提示找不到Mapp'...
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26297


关于mr的高效求topn的方法
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26298





about云2018年11月07日每日一读


技术 应用:
入门理解NLP中多通道卷积神经网络
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26294
1、如何理解多通道卷积神经网络?
2、如何随机初始化的embedding?
3、如何实现Multi_Channel_CNN?
4、如何应用stack函数?




名企资料:
孙金城丨阿里巴巴-Blink SQL关键技术及实现原理
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26293



视频:
39天大数据学习第39天:Spark netty及通信
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26292





about云2018年11月06日每日一读


介绍解说:
什么是Hive 钩子,如何实现钩子?
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26286
1.什么是Hive hooks?
2.什么是数据湖?
3.Hive钩子有哪些种类?
4.如何实现Hive钩子?



名企资源:
大数据之路:阿里巴巴大数据实践【书籍】
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26288


视频:
39天大数据学习第38天:Spark mllib机器学习
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26287


异常错误:
读取hbase数据到hdfs api 报错 网上搜不到 求解  错误java.lang.NoSuchFieldError...
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26285





about云2018年11月03日每日一读


autoencoder实现无监督学习
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26278
1.什么是autoencoder?
2.怎样做作无监督的Pretraining训练?
3.怎样实现无监督学习?



Spark 高级分析:第九章第3,4节 模型介绍和获取数据
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26271
1.什么是蒙特卡洛风险模型
2.模型公式是什么?

3.文中从哪里获取股票数据



名企资源:
新浪-高鹏_ClickHouse最佳实践
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26283


视频:
39天大数据学习第37天:平台精准推送系统解决方案(插播)等
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26282






about云2018年11月02日每日一读

比Hive快279倍的数据库-ClickHouse到底是怎样的
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26264
1.什么是ClickHouse?
2.ClickHouse适合哪些场景?
3.为什么面向列的数据库查询如此快?



文档:
Cloudera大数据解决方案
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26268


视频:
39天大数据学习第36天:Spark任务提交流程分析
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26267



疑问解答:
Rocky版上传镜像错误
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26266


方案探讨:
HDFS数据导入HIVE方案探讨
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26265




about云2018年11月01日每日一读


介绍解说:
为什么要在Kubernetes上运行Kafka,有哪些问题?
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26252
1.为什么要在Kubernetes上运行Kafka?
2.Kafka在Kubernetes需要注意哪些问题?
3.在Kubernetes上的部署Kafka时,需要什么团队方面的合作?



小知识点:
Cloudera Enterprise 6提高Hive执行效率2.2倍
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26251


视频:
39天大数据学习第35天:Spark源码阅读
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26255


书籍:
亿级流量网站架构核心技术
http://www.anilnutrients.com/forum.php?mod=viewthread&tid=26254





您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /3 下一条

QQ|小黑屋|about云开发-学问论坛|社区 ( 京ICP备12023829号

GMT+8, 2019-5-23 23:21 , Processed in 0.490913 second(s), 31 queries , Gzip On.

Powered by Discuz! X3.2 Licensed

快速回复 返回顶部 返回列表