elasticsearch超省存储空间的配置
搜索中的权重度量利器: TF-IDF和BM25
【转载】NLP之TF-IDF与BM25原理探究
win10禁用windows错误报告Werfault.exe
自建CDN和反向代理服务器软件
文本指纹算法和内容指纹系统介绍
微信域名是否被拦截检测接口
本篇文章已加密,请输入密码后查看。
阅读全部帆布算法,对客户端进行指纹识别(CANVAS FINGERPRINTING)
“帆布指纹识别”
windows下nginx+php,使用CURL请求本地URL会卡死的解决方法
在Windows上安装 v8js for PHP 让PHP能运行js代码
微信公众号爬虫方法之一
需求某某微信公众号历史的所有文章的阅读数和点赞数难点微信公众号历史的所有文章(来源???)每篇文章的阅读量和点赞量(电脑上浏览文章只显示内容,没有阅读量、点赞量、评论……)突破难点一搜狗微信搜索,可以搜索微信公众号文章。但是貌似只能显示该公众号最近十篇的文章。放弃……利用抓包工具(Fiddler),抓取文章。成本有点大…&a
阅读全部sublime text3---Emmet:HTML/CSS代码快速编写神器
一、快速编写HTML代码
... 阅读全部win10上在sublime安装PHPcs(PHPcodesniffer)代码规范提示插件
首先按教程 http://blog.csdn.net/cyaspnet/article/details/51773331 装好phpcs和phpmd,需要先安装composer
... 阅读全部中文分词 测试用例
中文分词 测试用例
转载:互联网时代的社会语言学:基于SNS的文本数据挖掘
今年上半年,我在人人网实习了一段时间,期间得到了很多宝贵的数据,并做了一些还算有意义的事情,在这里和大家一块儿分享。感谢人人网提供的数据与工作环境,感谢赵继承博士、詹卫东老师的支持和建议。在这项工作中,我得到了很多与众人交流的机会,特别感谢 OpenParty 、 TEDxBeijing 提供的平台。本文已发表在了《程序员》杂志,分上下两部分刊于 2012 年 7 月刊和 8 月刊,在此感谢卢鸫翔编辑的辛勤工作。由于众所周知的原因,《程序员》刊出的文章被和谐过(看到后面大家就自动地知道被和谐的内容是什么了),因而我决定把完整版发在 Blog 上,同时与更多的人一同分享。对此感兴趣的朋友可以给我发邮件继续交流。好了,开始说正文吧。
... 阅读全部sublime text 3 好用的插件整理【php开发环境】
Sublime Text 3设置吊炸天PHP开发环境 ================ 首先需要一个包管理器,如果没有,使用以下方法安装 使用Ctrl+`快捷键或者通过View->Show Console菜单打开命令行,粘贴如下代码: import urllib.request,os; pf = 'Packag
阅读全部sublime text 3 的php格式美化插件 phpfmt 参数详解
sublime text 3 的php格式美化插件 phpfmt 在编写代码时,自动对齐等格式化,可以省去很多时间。并且可以根据以下参数,优化格式风格。
可通过菜单:首选项->插件设置->phpfmt->settings-user 添加类似以下代码,修改美化风格。
=======================
经典的配置风格
=======================
...
阅读全部新创建的github空白版本库,在push代码时出错的解决方法
刚创建的github版本库,在push代码时出错:$ git push -u origin masterTo git@github.com:******/Demo.git ! [rejected] master -> master (non-fast-forward)error: failed to push some refs to 'git@github.com:******/Demo.git'hint: Updates were rejected
阅读全部