Python自然语言处理 Python自然语言处理:jieba分词,词频统计 一、实验目的 1.1、学习如何读取一个文件 1.2、学习如何使用DataFrame 1.3、学习jieba中文分词组件及停用词处... 阅读全文 2018-08-14 蔺光岭 1 条评论
MongoDB 搭建高可用MongoDB集群 1、MongoDB简介 MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 Mon... 阅读全文 2018-06-16 蔺光岭 0 条评论
Linux CentOS7创建用户、用户组及常见命令 1、添加用户和组名# 添加用户组名: groupadd hadoop # 创建指定用户 其中-d和-m选项用来为登录名linguangling产生一个主目录/home/linguangling... 阅读全文 2018-04-20 蔺光岭 0 条评论
Zookpeeper Zookeeper生产环境集群安装 1、Zookeeper简介 ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为... 阅读全文 2018-03-20 蔺光岭 0 条评论
BigData 大数据存储单位介绍 存储单位 计算机存储单位一般用bit、B、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB……来表示,它们之间的关系是: 阅读全文 2018-02-01 蔺光岭 0 条评论