夜息:小议SEO数据分析III – 维护词库

 前言

... 阅读全部

shell批量采集百度下拉框关键词

 一直想写一篇用shell采集百度下拉框关键词的教程,个人感觉用shell来采集的话速度和效率都会更高一点。因为前面写过一篇用火车头采集百度下拉框关键词的教程,操作步骤稍微多了些,很多朋友看完了仍然不知道怎么做,然后QQ问我,教程都写得很清楚明了,只要对照着来做,一定会成功的。

... 阅读全部

MySQL性能测试--分区和分表测试

 一,测试服务器配置:

Cpu: 2*4核Intel(R) Xeon(R) E5405 @ 2.00GHz

... 阅读全部

python实现批量查询网站的pr

 

批量查询网站的pr

... 阅读全部

IIS 6 下配置以 FastCGI 跑 PHP

 环境: 操作系统:Windows 2003 Server SP2 PHP 版本:php-5.2.6-Win321.下载 FastCGI For IIS6 fcgiext.dll – fastcgi处理程序 fcgiext.ini – 配置文件 fcgiconfig.js – FastCGI的控制脚本同时在 IIS

阅读全部

php正则导致segmentation fault (core dumped)

Cli模式运行php时,出现 segmentation fault (core dumped)  

先打开core存储

ulimit -c 1024

再运行php时,出错将保存一个core文件,

使用:

gdb php -c core

查看文件错误,发现错误位置为 prce
 
... 阅读全部

php解析json和jsonp的方法,以及json不能正常解析的几种情况

php解析jsonp先使用以下 //jsonp删除两端()function jsonp_2_json($jsonp) { // PHP 5.3 adds depth as third parameter to json_decode if ($jsonp[0] !== '[' && $jsonp[0] !== '{') { // we have JSONP $json

阅读全部

php正则匹配汉字的几种方法!

一般我们常用来匹配汉字的正则表达式是,/ [\u4e00-\u9fa5]+/ 发现一个更好的方法:/[\p{Han}]/u“\p{Han}匹配汉字, 正则原生支持, \u4e00-\u9fa5并不怎么精准”—— 来自:http://www.oschina.net/question/926655_143579 icekic

阅读全部

PHP 正则表达式

  点击下图,可以看具体内容!

...
阅读全部

Linux中gdb 查看core堆栈信息

 core dump 一般是在segmentation fault(段错误)的情况下产生的文件,需要通过ulimit来设置才会得到的。

...

阅读全部

Ubuntu LTS 安装/升级 MongoDB 3.x 的方法

 原文:https://docs.mongodb.com/manual/tutorial/install-mongodb-on-ubuntu/MongoDB only provides packages for 64-bit LTS (long-term support) Ubuntu releases. For example, 12.04 LTS (precise), 14.04 L

阅读全部

在线提取URL的根域名工具

 在处理采集域名做分析时,要用到顶级域名提取,即从 类似 www.crazyken.cn 的网址中 提取出 crazyken.cn 这个主域名,自己写工具挺麻烦的,在网上找到个非常好用的智能提取工具: 一键提取Url的根域名: https://www.a-site.cn/tool/domain/ 还支持自动去重,能批量从TXT文本中提取URL主域名,试了下,很多奇葩的新域名后缀也能顺利识

阅读全部

phpQuery的用法

 一、phpQuery的hello word!

下面简单举例:

... 阅读全部

Ngxin 绑定ssl后,引起的访问混乱,没绑定的域名访问https打开的是有ssl的网站内容

Nginx 对于找不到 hostname 的域名,默认采用第一个 host 

所以,需要自己加一个空的监听 443端口的 default server 

其中的 ssl.key 和 ssl.crt 必须设置,可以随便设置,不设置这个,正常的https网站也会无法打开

...

阅读全部

论免费增值模式的兴起

 这是 ONES Piece 翻译计划的第 124 篇译文。本文原载于 25iq.com,作者 Tren Griffin,由 ONES Piece 翻译计划 农颖 翻译。ONES Piece 是一个由 ONES Ventures 发起的非营利翻译计划,聚焦科技创新、生活方式和未来商业。如果您希望得到更「湿」的信息,我们也有播客节目「迟早更新」供您收听。

... 阅读全部

MYSQL中文全文检索(mysqlcft插件)

**** 首先需要表类型为:MyISAM****  
 
下载安装插件。
 
mysql>
 
SHOW VARIABLES LIKE 'plugin_dir';
 
确定插件路径:/usr/local/mysql/lib/plugin
 
... 阅读全部

php使用正则删除连接重复的词、字、符号、单词,多次重复只保留1个

php使用正则删除连接重复的词、字、符号、单词,多次重复的内容只保留1个,方法如下:<?php$str = '太好了呀太好了呀太好了呀太好了呀太好了呀太好了呀正工则正工则正则正则正则正则正则abcabcabababaccccccccccc试试试试试试试测试则为连接连接接接接接接接!!!!!!!!!!!!!!!!!!!!!!!!!!';$p = '/(.*)\1{1,10}/i';$str =

阅读全部

PHP cURL实现模拟登录与采集使用方法详解教程

 本文将通过案例,整合浏览器工具与PHP程序,教你如何让数据 唾手可得 

... 阅读全部

PHP基于cURL实现自动模拟登录

 本文介绍如何利用php基于curl命令,实现自动模拟登录。

...
阅读全部

MySQL 百万级-千万级分页优化

 少量翻页使用:SELECT * FROM table ORDER BY id LIMIT 1000, 10; 优化型翻页:SELECT * FROM table WHERE id >= (SELECT id FROM table LIMIT 1000000, 1) LIMIT 10; 超快速优化页:SELECT * FROM table WHERE id BE

阅读全部