jieba
Install
$ pip install jieba
Demo
1 | # encoding=utf-8 |
$ pip install jieba
1 | # encoding=utf-8 |
简单说,词云是根据一段文字里的关键词出现频率生成文字的图片组合,字体越大说明对应的词汇的频率越高!词云适合分析一些文本类型的字段,比如用户职位分布、热点词分析等。
$ pip install wordcloud
在线工具
Wordle是一个用于从文本生成词云图而提供的游戏工具
Tagxedo 可以在线制作个性化词云
Tagul 是一个 Web 服务,同样可以创建华丽的词云
Tagcrowd 还可以输入web的url,直接生成某个网页的词云
Python实现1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17import matplotlib.pyplot as plt
from wordcloud import WordCloud
import jieba
# 是读取本地的文件
text_from_file_with_apath = open('/Users/hecom/23tips.txt').read()
# 使用jieba进行分词,并对分词的结果以空格隔开
wordlist_after_jieba = jieba.cut(text_from_file_with_apath, cut_all = True)
wl_space_split = " ".join(wordlist_after_jieba)
# 对分词后的文本生成词云
my_wordcloud = WordCloud().generate(wl_space_split)
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()
此处登记个人觉得好使的插件
Chrome欢迎页
https://chrome.google.com/webstore/detail/earth-view-from-google-ea/bhloflhklmhfpedakmangadcdofhnnoh
GitHub的快捷目录
https://chrome.google.com/webstore/detail/octotree/bkhaagjahfmjljalopjnoealnfndnagc
https://chrome.google.com/webstore/detail/wappalyzer/gppongmhjkpfnbhagpmjfkannfbllamg
https://chrome.google.com/webstore/detail/jsonview/chklaanhfefbnpoihckbnefhakgolnmc
Chrome页面标尺,专治Web开发组件排版强迫症
https://chrome.google.com/webstore/detail/grid-ruler/joadogiaiabhmggdifljlpkclnpfncmj
一键切换至IDE
https://chrome.google.com/webstore/detail/jetbrains-ide-support/hmhgeddbohgjknpmjagkdomcpobmllji
今天在升级一个系统时遇到个小问题,系统是完全前后端分离(Vue + Egg / SpringBoot)
,靠接口签名来验证身份,重点来了,接口签名算法用到时间yyyyMMddHH
的字符串。
部署前端(Vue + Egg)机器A:
用root用户
登陆输入date
命令出来的时间是东八区
,但是切换到部署系统用户
后是零时区
…这就坑爹了
A机器生成的签名,去到B机器肯定校验不通过啦!!!
部署后端(SpringBoot)机器B:
最近有同学升级了A机器的libc-2.12.so -> libc-2.14.so文件导致,降级后消除异常
定义挖掘目标
针对具体的数据挖掘应用需求,首先要明确本次的挖掘目标是什么?系统完成后能达到什么样的效果?因此必须分析应用领域,包括应用中的各种知识和应用目标,了解相关领域的有关情况,熟悉背景知识,弄清用户需求。要想充分发挥数据挖掘的价值,必须要对目标有一个清晰明确的定义,即决定到底想干什么。
目标定义(任务理解,指标确定)
数据采集(建模抽样,质量把控,实时采集)
数据整理(数据探索,数据清洗,数据变换)
构建模型(模式发现,构建模型,验证模型)
模型评价(设定评价标准,多模型对比,模型优化)
模型发布(模型部署,模型重构)
业务系统 -> 数据抽取(ETL) -> 数据探索与预处理 -> 建模&应用 -> 结果&反馈
archey
,需要brew install archey
brew install ccat
brew install autojump
brew install tree
sleep 5 && say "Hello World"
5秒后电脑说出HelloWorldmvn clean install && say 'build ok!!!'
编译耗时长不想一直等待,可以巧妙使用&&
1 | cal // 查看当前日历 |
1 | 命令运行之后需要重新加载Finder:快捷键option + command + esc,选中Finder,重新启动即可 |
control + command + 空格
option + shift + k
fn + delete
毕业3年多了,这回第一次写年终总结。本来应该是上周春节假期期间搞掂的,但是节前突然发生几个事情给耽误了…
如下思维导图,前段时间就开始整理了,这次只能给60分…整理欠佳
工作&学习
按部就班没有特出的贡献(对个人来说这个非常不利于可持续发展),也有跟外包定位有关(救火人员,哪里需要就去哪里)。
断断续续把Hadoop、HBase、Hive、Spark等框架教程看过,对大数据领域开发有初步了解,但是还不够系统以及实操欠佳,接下来半年的重点突破地方。
家庭/生活
…
工作&学习
微信/网页/为知笔记
整理转型到 Hexo/备忘录(iCloud)
获得 ?? 次赞同
,两位数的赞同,目前是5😢家庭/生活