折腾日记

  • 吹一波buyvm

    caddy 9000以上连接数 破2G的上传 机器负载690(更高的没截到) 因为内存不够机器caddy崩了 不然可能各项都会正常 上传随时可破G口 月付还便宜 太香了

    2020年6月22日 0 24 0
  • 调整swap内存使用优先级优先使用swap

    低配服务器通常会使用swap来缓解服务器内存压力,但是很多设置之后即使内存已经跑爆了 swap使用量也不过才100MB左右的使用量。此时我们可以通过调整swappiness的值来提高使用优先级。 在ubunt系统中swappiness默认60 而在centos中默认10 所有在centos中swap内存的使用率是很低的。 1.查看当前swappiness值 $ cat /proc/sys/vm/swappiness2.修改swappiness值为10(临时修改,重启后即还原为默认值) $ sudo sysctl vm.swappiness=10 3.永久修改swappiness默认值(重启生效)$ sudo gedit /etc/sysctl.conf在文档的最后加上:  vm.swappiness=10保存重启,搞定收工! 不过设置之后mysql的内存使用大部分都到了swap但是php的还是停留在内存上,200MB的内存只会使用3-5MB的虚拟内存 同理如果需要优先使用内存 则调低swappiness的值即可

    折腾日记 2020年6月11日 0 33 0
  • python利用session来模拟登录进行爬虫抓取

    很多网站内容在抓取时需要进行登录,不登录则无法获取到内容,这时就需要session来模拟进行登录的过程,有人会问使用cookie不行吗,当然不行,cookie只能在本地环境下使用,也就是你浏览器登录之后抓取cookie写入,然后再在本地运行脚本才能使用,当你放到服务器之后这个cookie就相当于失效的。 session模拟登录 上面代码可以看到 通过header定义了访问所需的ua标示 然后通过data定义登录需要填写的信息。 url1定义了登录地址(因为某些问题隐藏,可以在我开源的teelebot-invitecode的项目里查看) sess来定义 reuests模块的Session方法 最后通过f = sess.post(url1, data=data, headers=header)来进行post提交数据,这时requests会自动对你的cookie进行操作,后面的抓取页面等操作直接使用sess.get进行操作即可,注意用的什么变量post的就要使用什么变量进行get操作,因为cookie只会绑定在这个变量里面 1

    折腾日记 2020年5月31日 0 85 0
  • 如何利用teelebot机器人框架快速开发telegram机器人

    框架开源地址:https://github.com/plutobell/teelebot 准备工作 安装python3.x环境,程序不支持2.x的python版本。 可以访问telegram的服务器或是你的电脑可以访问。 学习python编程语言。 文件结构 有了teelebot框架我们只需要进行简单的插件开发即可,下面的是插件文件结构。 这里以作者的示例项目为例: __init__.py 文件代码如下: 第一行格式#指令第一行设置的是触发指令,可以是任意组合建议前面加上/来规范书写,也方便后面在botfather来添加指令模块. 第二行#指令说明不多做解释 Hello.py 代码如下: 第一行设定编码格式不多做解释,不理解的直接复制即可 第二行引入这个bot库 不多做解释,直接复制到你的插件文件里面即可 第三行 def Hello(message):python的函数定义,其中Hello(message)是固定的格式 插件名称(message)需要注意的是插件名称一定要和你的插件文件是相同的.比如Hello.py就要对应函数Hello(message) Chat.py就要对应Chat(message) printf这一行不说了都会 第五行bot = bot()将bot()类赋给bot变量 类定义在teelebot/teelebot.py文件夹内 可以在文件夹查看类所有的方法 第六行status = bot.sendChatAction(message["chat"]["id"], "typing") 实际上等于bot.sendChatAction(message["chat"]["id"], "typing") 通过翻译就能看出 发送输入状态命令message["chat"]["id"]就是传入的会话 ,这一部分也可以直接替换用户id来实现发送给指定用户。 第七行status = bot.sendPhoto(message["chat"]["id"], bot.plugin_dir + "Hello/helloworld.png", reply_to_message_id=message["message_id"])编辑的前一天 框架作者迭代了版本增加了回复功能。 也是从翻译来看 发送图片 功能很明显message["chat"]["id"]还是用来指定会话。bot.plugin_dir + "Hello/helloworld.png"用来说明图片引用的地址, `bot.plugin_dir在配置confi.cfg文件时就能看到需要自行手动填写位置。reply_to_message_id=message["message_id"])这段是新加的,用来回复指定消息,如果不需要回复功能这段其实可以直接不写。 扩展一个方法 bot.sendMessage:发送信息,需要传入三个参数 id,消息文本,类型(默认为txt).。发送类型还有另外三种"Markdown", "MarkdownV2", "HTML" 示例:bot.sendMessage(message["chat"]["id"],"lbwnb","HTML") 上面介绍的只是一个简单的回复消息功能,其他功能可以通过你自己的编写来实现,比如我搞出来的邀请码模块,实际上我学python7天就搞出来了。 要注意的是bot库的引入和bot()的赋值,与函数名的定义问题。这三个是重中之重。其余有问题左侧q我或是留言都可以。

    折腾日记 2020年5月27日 0 77 0
  • 记一次CDN被刷

    106.12.91.15 nmsl,??。 上午收到阿里的短信提示我cdn欠费,我回头一想 我这小破站也没啥人访问啊 怎么可能欠费,于是到控制台一看,发现从9点开始刷到11点开始被刷了56G流量,因为阿里看不到当天记录 我就下午充值了一次,但是充值之后没多长时间又欠费了。于是在日志管理看了下当天日志,发现存在这么一个IP在访问资源,上IPIP一查发现是个百度的地址,一开始还以为是百度的爬虫,但是一翻记录发现不对劲,这IP一直在不断的访问一个资源 于是果断拉黑,顺便申请了频次控制。您可千万别让我查着您也建站还用了cdn了?

    2020年5月27日 0 78 0
  • Python判断文件最后一行是否是空行

    先提供两种提取最后一行文本的方案: 读取小文件时: 读取大文件时: 以上两种方式在实测的时候如果文件最后存在空行,都不会实际输出空行,如下: 可见文件中存在空行但是最后的输出却不是空行,而是倒数第二行存在内容的一行。 这问题也是前两天开发机器人的补码模块的时候发现的问题,百度之后发现所给的文章都不大适合我这种7天python新手,于是自行进行写入读取 发现如果最后一行存在空行,那么是存在一个换行符的,当然明面上是看不到的,于是修正代码如下: 结果如下: 存在空行时会提示存在空行,修改文件,删除最后的空行,结果如下: 这时已经正确的判断了文件最后一行是否存在空行。

    2020年5月25日 0 83 0
  • tg邀请码机器人源码 自动发码 数量统计 无码提醒

    简介 因为论坛和部分网站需要发送邀请码邀请注册,人工发码又太慢,于是想到tg机器人发码,但是找了很多项目都没有找到类似的开源项目,偶然间看到了teelebot开源的tgAPi框架 于是参考着示例 ,用我学了半个月的半吊子python 写出了这个暂时能用不会报错的telegram邀请码机器人 目前已经到我理想状态,短期内不会进行功能更新,学习比较重要。 增加功能 1.邀请码自动发码模块 并且限制领取数量(邀请码添加在invite_code目录下的code.txt 一行一个) 用户信息存储在usertext.txt文件内 2.邀请码数量统计,如果邀请码用完自动给管理员发消息(需自行修改len_invite.py里面的发送id) 3.补码模块已经添加 目前并不是很理想的状态但是可以用使用方法 注意:一行一个注意换行 4.删除用户信息模块,删除后用户可以再次获取邀请码指令/del用户id目前只能删除单个用户 5.mps的自动补码模块 请在/plugins/updatacode/updatacode.py文件内填写网站登录信息,目前只会抓取两页邀请码,需要手动更新,后期会添加自动执行进去。 开发计划 1.增加管理员添加邀请码模块 2.多类邀请码模块支持 3.统计需改成json数据 目前统计方式过于简易(已完成) 4.管理员补码:暂定计划1,发送补码指令并跟随邀请码,格式为一行一个,然后剔除指令文本,后使用write写入code.txt文件中。 计划2:用户发送指令后开始监听,将用户发送的后续文本写入文件中,需发送特定指令来结束输入 环境要求 Python版本 teelebot 只支持 Python3.x,不支持Python2.x。 使用 一、源码运行 1.克隆或点击下载本项目到本地,保证本机安装有Python3.x版本和包requests(删除了多余模块不需要了); 2.config.cfg 配置文件 配置文件格式: [config] key=your key root=your user id debug=False timeout=60 plugin_dir=your plugin dir //[Optional] Linux 在 /root 目录下创建文件夹 .teelebot ,并在其内新建配置文件 config.cfg ,按照上面的格式填写配置文件 Windows 在 C:\Users\<username> 目录下创建文件夹 .teelebot ,并在其内新建配置文件 config.cfg ,按照上面的格式填写配置文件 指定配置文件 Linux 和 Windows 都可在命令行通过参数手动指定配置文件路径,命令格式: 路径必须为绝对路径。 3.运行 终端下进入teelebot文件夹所在目录。 对于使用程序配置文件默认路径的:输入python -m teelebot 回车,正常情况下你应该能看见屏幕提示机器人开始运行。 对于命令行手动指定配置文件路径的:输入python -m teelebot -c/-C <configure file path> 回车,正常情况下你应该能看见屏幕提示机器人开始运行。 更新日志 2020-6-2:忘记写了好几次更新 看gayhub吧 每次push都挺明确的,这也是我第一次认真的去做一个东西 2020-5-25:增加删除用户模块 2020-5-24:提交补码模块 目前不是最理想的状态 2020-5-21:晚11点提交,将用户校验升级为json 2020-5-21: 修复因代码顺序导致的邀请码异常减少的问题

    2020年5月21日 1 235 0
  • 关于Python爬虫的初次尝试

    萌鼠归档页面链接爬取 使用requests库进行请求 BeautifulSoup进行网页的解析 最终字典使用转换为json和str的方式分别存储进了两个不同的text文件中 本站归档页抓取 因为没有像萌鼠那样归档页面的a标签设置了class,本站的抓取稍微废了点功夫 并且还有一个问题存在,网址使用正则进行匹配 ,标题并没有正确的完成匹配 残留了一部分内容没有删除掉

    折腾日记 2020年5月18日 0 70 0
  • [服务器推荐]FranTech 月付10元1H1G 不限流量

    loc上推荐的机器。国内访问延迟较高,但是不限量香啊 PT 离线都很舒服的机器 配置信息 Zbench做的测试,图上可以看出 3900X的处理器非常香 硬盘测试也是比较理想 这里是挂载了1.25刀硬盘之后做的测试,没记错阿里和腾讯的学生机都是200MB/s的 I/O。 网络测试 网络测试就有点玄学 这个太原我测试了两遍都是8ms的延迟。 下载速度这里看起来海星,部分地区的下载速度个人来说还是非常满意。 自用的aria2下载onedrive文件一直是保持在50MB/s以上的速度 GD也是可以保持50mb/s的一个速度 上传目前是没有测试过 这个机器配合aria2做一个离线下载自动上传刀gd或是od是非常香的 加一个256G硬盘一个月也才20出头的价格。 购买地址 是不是灵车请自行辨认 每个人用途不一样,对我来说我只用离线下载和pt对我来说足够了这个价格也合适

    2020年5月11日 0 89 0
  • Linux安装Deluge 刷PT

    Deluge是一款免费的 BT 传输软件,相比于其他同类产品,Deluge完美支持各大主流操作系统( Windows 、 Linux 、 Mac OS ),软件体积小巧、绿色安全,而且传输速度快,是一款很不可多得的传输工具。Deluge程序使用libtorrent作为其后端,有包括GTK+、网络远程客户端、命令行模式等多种用户界面,占用系统资源少,有丰富的插件来实现核心以外的众多功能。 脚本下载: 安装:./install-deluge.sh -install 卸载:./install-deluge.sh -uninstall 安装完成之后会有端口和账号密码提示 登陆后自行修改即可。

    折腾日记 2020年5月11日 0 64 0