第97页_互联网科技_热门IT资讯网

导航：首页 > 互联网科技 >

互联网科技列表

Hive-1.2.0学习笔记汇总

鲁春利的工作笔记，谁说程序员不能有文艺范？Hive-1.2.0学习笔记（一）安装配置http://luchunli.blog.51cto.com/2368057/1693817Hive-1.2.0学习
Appium测试过程

测试步骤：定位--->交互--->断言定位方法：id（重要）：对应 resource-idaccessibility id：对应 content-desc（重要）xpath（重要）---------
Hadoop基础入门学习笔记（基本概念）

一、数据块(blck)HDFS(Hadp Distributed File System)默认的最基本的存储单位是64M的数据块。和普通文件系统相同的是，HDFS中的文件是被分成64M一块的数据块存储
Spark中Cache与Persist的巅峰对决

Cache的产生背景我们先做一个简单的测试读取一个本地文件做一次collect操作：val rdd=sc.textFile("file:///home/hadoop/data/input.tx
分布式系统设计基础知识

在云计算，大数据，互联网等领域，都存在集群的概念，那么如何进行集群管理呢？虽然各有各的实现方式，但是思想都一样，通过leader管理一个集群，有自己的选举算法。而且集群中相似功能的组件也很多，可供用户
关于10G/40G/100G数据中心光纤布线知识

随着人们对于数据中心的扩建与可扩展性要求的不断增大，如何实现数据中心从40G/100G向400G的平滑演进成为一个在问题，提升竞争力成为布线甚而设施必须实现可靠性、可管理性和灵活性。光纤连接解决方案可
基于 Elasticsearch 搜索平台

背景随着公司业务的高速发展以及数据爆炸式的增长，当前公司各产线都有关于搜索方面的需求，但是以前的搜索服务系统由于架构与业务上的设计，不能很好的满足各个业务线的期望，主要体现下面三个问题：不能支持对语句
OpentTsdb官方文档中文版----查询性能

缓存此时OpenTSDB没有内置缓存（除了将缓存PNG图像文件60秒的内置GUI）。因此只能依靠底层数据库的缓存。在HBase（最常见的OpenTSDB后端）中，有一个块缓存的概念，它可以在写入
spark调优（三）：RDD重构和持久化

第一，RDD架构重构与优化尽量去复用RDD，差不多的RDD，可以抽取称为一个共同的RDD，供后面的RDD计算时，反复使用。第二，公共RDD一定要实现持久化对于要多次计算和使用的公共RDD，一定要进行持
bash 解析XML的脚本

parseXmlFile.sh#!/bin/bashUsage(){echo "Usage: ./parseXmlFile.sh "exit 1}list_all_entity(){local IFS
postmant 发送post请求

一、准备工作1. 分析请求在浏览器的开发者控制面板，打开network，选择要跟踪的请求，查看headers部分。Headers分为：General，查找Request URL和 Request M
二、spark--spark core原理与使用

[TOC]一、spark中一些基本术语RDD：弹性分布式数据集，是spark的核心重点算子：操作RDD的一些函数application：用户的写的spark程序（DriverProgram + Exe
loadrunner11使用常见问题（不断整理中）

loadrunner11使用常见问题脚本录制为空1. 检查协议是否正确；2. 关闭无关浏览器，设置IE或者火狐为默认浏览器；3. 录制选项 -> Network -> 端口映射 -> 捕获级别，修改为
自动化单元测试

自动化单元测试人们在使用"单元测试"这个术语时比较随意。这可能会导致困惑，特别是当人们开始声称他们的单元测试"花了很长的时间执行"时。为开发者测试定义一个常用词汇表有助于将测试进行有效的分类，从而创建
SpringBoot学习（五）—— springboot快速整合Druid

Druid连接池简介由阿里巴巴开源的druid连接池是目前综合实力最突出的数据库连接池，而且还提供了监控日志功能，能够分析SQL执行情况。引入druid连接池pom.xml中加入 com.ali
大数据运营之大数据应用

本文摘自：李福东《大数据运营-服务型企业架构新思维》3.3.9对于企业来说，大数据服务的目标可以归结为"降本增效"四个字。企业可以借助大数据服务做精准化营销，将企业的产品有效地传递给有此需求的用户，在
Kafka单线程Consumer及参数详解

请使用0.9以后的版本：示例代码 Properties props = new Properties(); props.put("bootstrap.servers", "kafka01
hive中数据倾斜

数据倾斜通常指hive根据key值hash分发到各个节点，相同的key值会分发到一个执行节点中，由于某些key值对应的数据量比其它key值的数据量大很多，导致某些执行节点的运行时间远大于其它节点，从而
制作发货统计报表

1、问题描述发货统计表是企业常用的报表之一，内容可能包括本周数、本月数、本年数、去年数、同比增减、计划数等，甚至有的还要与业务员的工资挂钩，需要直接计算出奖惩工资呢。如果让你计算以上数据，你会用什么方
使用Windbg内核调试连接调试用户态程序的方法

1. 中断目标计算机； 2. kd>!process 0 0 3. 找到要调试的程序对应进程； 4. kd>.process /i TARGETPROCESSADDRESS 5. kd>g 6. kd