找到约562条相关结果
相关搜索 spark

hadoop记录篇9-cm5安装zookeeper,hadoop

Apache Hadoop(Common、HDFS、MapReduce、YARN)Apache HBaseApache ZooKeeperApache OozieApache HiveHue(已获 Apache 许可)Apache FlumeCloudera Impala(许可的 Apache)Apache SentryApache SqoopCloudera Search(许可的 Apache)Apache Spark您正在使用 Cloudera Manager 安装和配置您的系统。您可以通过单击上面的支持菜单了解更多有关 Cloudera Manager 的信息。

https://blog.csdn.net/liaomin416100569/article/details/80045833 - PR2680- 2022-12-23 18:28:49- 快照

全球100款大数据工具汇总(后50款)_大数据周刊的博客-CSDN

方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等。67、Azkaban一款基于Java编写的任务调度系统任务调度,来自LinkedIn公司,用于管理他们的Hadoop批处理工作流。Azkaban根据工作的依赖性进行排序,提供友好的Web用户界面来维护和跟踪用户的工作流程。68、 Splunk是机器数据的引擎。使用 Splunk 可收集、索引和利用所有应用程序、服务器和设备(物理、虚拟和云中)生成的快速移动型计算机数据,从一个位置搜索并分析所有实时和历史数据69、Pentaho是世界上最流行的开源商务智能软件,以工作流为核心的、强调面向解决方案而非工具组件的、基于java平台的商业智能(Business Intelligence)套件。

https://blog.csdn.net/r6Auo52bK/article/details/78929232 - PR2901- 2022-12-23 18:29:02- 快照

熊劲-中国科学院大学-UCAS

Using Vectorized Execution to Improve SQL Query Performance on Spark. Proceedings of the 50th International Conference on Parallel Processingnull. 2021, [4] 王盈, 蒋德钧, 熊劲. 一种面向非易失性内存文件系统的数据读写粒度控制策略. 高技术通讯[J]. 2021, 692-704, https://t.cnki.net/kcms/detail?v=3uoqIhG8C46NmWw7YpEsKMypi3qVj28LEUDxQXHYyS3fbyEOrIfBzPPc88OfC7xRfx1si6g5-e_hTEqAfWttRUXWjgckQfa-.[5] 韩书楷, 熊子威, 蒋德钧, 熊劲. 基于持久化内存的索引设计重新思考与优化. 计算机研究与发展[J]. 2021, 356-370, http://lib.cqvip.com/Qikan/Article/Detail?id=7103851295.[6] 申毅杰, 曾丹, 熊劲.

http://people.ucas.ac.cn/~0000972 -PR4coI- 2022-12-23 19:10:29- 快照

CDH5.8 HUE的使用(那些年走过的坑)_gao123456789amy

核心功能SQL编辑器,支持Hive, Impala, MySQL, Oracle, PostgreSQL等数据可视化Spark、Hadoop、Sqoop的友好界面支持支持调度系统Apache Oozie,可进行workflow的编辑、查看,任务调度下面我在HUE的安装和使用中走过的坑。CDH版HUE的安装在CDH上安装HUE很简单,只要在Cloudera manager中添加服务即可,但是到第三步(如下图)的时候要小心,默认使用嵌入式数据库,随机生成密码,此时如果你按默认方式直接点击继续,并且没有记住密码的话,后面想为HUE更改数据库时可能丢失所有数据,反正我当时把hue的数据库改成mysql,没有找到PG的密码,所有数据重新来过。HUE的配置hue的时区修改这里讲一个时区和数据库。 因为是用hue,很重要的功能是是用workflow和Coordinator来调度任务,这就牵涉到时间。

https://blog.csdn.net/gao123456789amy/article/details/79242713 - PR2511- 2022-12-23 18:28:38- 快照

目前颜值最高的开源BI工具-Superset_51CTO博客_

superset筛选器ITsuperset 安装配置一、配置python虚拟环境,请参考 superset依赖python3.6环境 https://www..com/xibuhaohao/p/9994854.html 二、安装配置superset 参考superset官网 1.安装依赖包 For Fedora and RHEL-der数据报表分析pythonmysql依赖包虚拟环境superset + KYLIN + HIVE AND IMPALA# kylin SQLAlchemy URI kylin://ADMIN:XXXXXXXXXX@qing-spark-srv4:7070/learn_kylin # impala SQLAlchemy URIimpala://qing-spark-srv4:21050/test   

https://blog.51cto.com/u_15187242/2749157 - PR8290- 2022-12-23 18:34:15- 快照

火山引擎在行为分析场景下的 ClickHouse JOIN 优化

解决方案3.1 避免JOIN3.1.1 数据预生成数据预生成(由 Spark/Flink 或者 Clickhouse 物化视图产出数据),形成大宽表,基于单表的查询是 ClickHouse 最为擅长的场景。我们有个指标,实现的 SQL 比较复杂(如下),每次实时查询很耗时,我们单独建了一个表 table,由 Spark 每日构建出这个指标,查询时直接基于 table 查询。SELECT event_date,count(distinct uc1) AS uv,sum(value) AS sum_value, ......

https://blog.csdn.net/ByteDanceTech/article/details/126716600 - PR6512- 2022-12-23 18:32:42- 快照

Python几种主流框架 - yonziliu - 博客园

Dpark:Python版的SparkDPark是Spark的Python克隆,是一个Python实现的分布式计算框架,可以非常方便地实现大规模数据处理和迭代计算。DPark由豆瓣实现,目前豆瓣内部的绝大多数数据分析都使用DPark完成,正日趋完善。Buildbot:基于Python的持续集成测试框架Buildbot是一个开源框架,可以自动化软件构建、测试和发布等过程。每当代码有改变,服务器要求不同平台上的客户端立即进行代码构建和测试,收集并报告不同平台的构建和测试结果。Zerorpc:基于ZeroMQ的高性能分布式RPC框架Zerorpc是一个基于ZeroMQ和MessagePack开发的远程过程调用协议(RPC)实现。和 Zerorpc 一起使用的 Service API 被称为 zeroservice。Zerorpc 可以通过编程或命令行方式调用。Bottle: 微型Python Web框架Bottle是一个简单高效的遵循WSGI的微型python Web框架。

https://www.cnblogs.com/sthu/p/8599544.html - PR5535- 2022-12-23 18:31:36- 快照

徐静涛-中国科学院大学-UCAS

performance optimizing in SnTe by Mn-alloying via zone-melting method,Journal of Materials Chemistry A,2015,通讯作者 (5) Systematic studies on anharmonicity of rattling phonons in type-I clathrates by low-temperature heat capacity measurements,Physical Review B ,2014,通讯作者 (6) Electron and Hole Injection via Charge Transfer at the Topological Insulator Bi2–xSbxTe3–ySey–Organic Molecule Interface,The journal of physical chemistry C,2014,第5作者 (7) THermoelectric Properties of CdTe1-xClx Material Prepared by Spark

http://people.ucas.ac.cn/~0029391 -PR4jN5- 2022-12-23 20:43:38- 快照

The Neo4j Getting Started Guide

Neo4j Ops ManagerNeo4j Graph Data ScienceNeo4j Graph Data Science LibraryCypher Query LanguageCypherCypher Cheat SheetCypher RefcardAPOCNeo4j Drivers and APIsGo DriverJava DriverJavaScript Driver.Net DriverPython DriverNeo4j GraphQL LibraryHTTP APIOGM LibrarySpring Data Neo4jNeo4j Connector for Apache Spark

https://neo4j.com/docs/getting-started/3.5/ - PR4363- 2022-12-23 18:30:23- 快照

The Neo4j Drivers Manual v1.7 -

Neo4j Ops ManagerNeo4j Graph Data ScienceNeo4j Graph Data Science LibraryCypher Query LanguageCypherCypher Cheat SheetCypher RefcardAPOCNeo4j Drivers and APIsGo DriverJava DriverJavaScript Driver.Net DriverPython DriverNeo4j GraphQL LibraryHTTP APIOGM LibrarySpring Data Neo4jNeo4j Connector for Apache Spark

https://neo4j.com/docs/driver-manual/1.7/#driver-get-the-driver - PR4362- 2022-12-23 18:30:29- 快照

Copyright ©uecom 京ICP备18064371号-1 IPV6
2024-03-28 22:27:02
uenu.com
10.0.12.16