Zaxon

2021

2022-01-01- 2022-01-02

harumonia

反思是为了更好的前进, 本篇主要是对已经过去的 2021 年的一些简单的思考与觉悟.

不过这些思考的内容大多是在年末所有感而发的. 以 2021 为标题确实有点言过其实了(笑.

bash脚本 - 过期日志文件清理

2021-09-17

harumonia

公司服务器上的日志文件多年积压, 已经占用了很大一部分不必要的内存空间. 所以本篇将完成一个功能性脚本, 其内容是扫描过期的日志文件, 并对文件进行对应的操作.

好久没有写过 bash 脚本了, 本篇也算是对这项技能的一个温习吧.

源流清泉 > Shell

实用小工具脚本

pdfplumber内存泄露问题解决方案(施工中)

2021-09-14

harumonia

在使用 pdfplumber 时会出现内存递增的情况, 最终导致内存的爆炸, 这一点在高频率地调用时尤为明显.
本篇主要解决的就是 pdfplumber 这个依赖包所导致的内存泄露问题.

源流清泉 > Python

Poirot 开发记录(2) - 字体抽取和OCR的优化方案

2021-08-25- 2026-02-22

harumonia

承接前面两篇, 字体反爬虫解决方案和进度条方案, 本篇是对旧版本的 Poirot 部分内容的性能优化.

主要优化内容为:

使用 Pillow 从字体文件中抽取出字形图片
使用 Tesseract 进行 OCR 识别

~~当然还有一些细枝末节的优化, 如 socketio 的版本升级等, 这其中又遇到了一些小问题, 会在文末一并总结.~~

源流清泉 > Python

kex_exchange_identification问题及解决

2021-07-18

harumonia

简单地记述了一下在使用 github 时遇到的 kex_exchange_identification 错误.

毕业旅行

2021-06-28- 2026-02-22

harumonia

本篇又是一个日常记述, 主要内容是博主毕业旅行的二三事.

目的地定在成都 , 来回耗时 7 天, 包括交通费在内的人均总开销 3985.51RMB. 乘兴而来, 兴尽而归, 总的来说世一趟很不错的旅行.

Christin开发记录(2) - nginx和前后端分离

2021-06-12- 2021-06-15

harumonia

在Christin 开发记录(1)中，我们讲过了这个项目的大体的设计思路，本篇以及之后的几篇将会详细地阐述各个技术要点的具体实现方案。

本篇主要的内容是 nginx 在 前后端分离 和 多语言开发 的代理作用.

源流清泉 > Python

大学生活阶段性小结

2021-06-11- 2026-02-22

harumonia

醉花阴 - 满船清梦

红山微雨凉初透, 孤帆见重楼. 金陵一樽酒, 栏干拍遍, 难解少年愁.
杏坛归离芒种后, 三尺决九州. 还酹江天月, 醉里挑灯, 共此韶华旧.

– harumonia, 二〇二一年六月, 于南京中医药大学

fastNLP和spaCy的使用

2021-06-06- 2026-02-22

harumonia

fastNLP 和 spaCy 都是自然语言处理常用的算法包,本篇将会应用的角度,分别使用这两个算法包训练一个可用的命名实体识别模型.

源流清泉 > Python

毕业设计自然语言处理

Christin开发记录(1)

2021-05-21- 2026-02-22

harumonia

关于 Christin

Christin 是笔者本科毕业设计的伴生项目, 笔者本科毕业设计的课题叫做 基于多元异构数据的中医药知识图谱构建及应用 , 作为其实践产物的平台,我将其命名为 Christin , 选名自我所以喜爱的 ARPG 游戏系列 <伊苏> 的主角 亚特鲁-克里斯汀( Adol Christin ) 以及我第二喜欢的小说家 Dame Agatha Mary Clarissa Christie. 当然, 其对外的平台名称叫做 中医药知识图谱构建平台.

本系列将主要介绍这个项目开发的思路 / 完善过程 与 技术栈 . (截止到毕设答辩前夕)

源流清泉 > Python