- LLMs 千面郎君:https://github.com/km1994/LLMs_interview_notes
- 介绍:该仓库主要记录 大模型(LLMs) 算法工程师相关的面试题
- LLMs九层妖塔:https://github.com/km1994/LLMsNineStoryDemonTower
- 介绍:【LLMs九层妖塔】分享 LLMs在自然语言处理(ChatGLM、Chinese-LLaMA-Alpaca、小羊驼 Vicuna、LLaMA、GPT4ALL等)、信息检索(langchain)、语言合成、语言识别、多模态等领域(Stable Diffusion、MiniGPT-4、VisualGLM-6B、Ziya-Visual等)等 实战与经验。
- NLP菜鸟逆袭记:https://github.com/km1994/AwesomeNLP
- 介绍:【NLP菜鸟逆袭】分享 自然语言处理(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等)等 实战与经验。
- NLP 面无不过:https://github.com/km1994/NLP-Interview-Notes
- 介绍:该仓库主要记录 NLP 算法工程师相关的面试题
- 【关于 NLP】 那些你不知道的事:https://github.com/km1994/nlp_paper_study
- 介绍:该仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记
梳理 NLP基础任务(文本分类、命名实体识别、关系抽取、事件抽取、文本摘要、文本生成、Prompt)和 LLMs 大模型等开源项目,争取做成一个全网最全NLP小白入门教程!
- NLP菜鸟逆袭记
- NLP菜鸟逆袭记——【多类别文本分类】笔记
- 多类别文本分类 实战篇
- NLP菜鸟逆袭记——【多类别文本分类】实战
- 非预训练类模型
- FastText
- TextCNN
- TextRNN
- TextRCNN
- Transformer
- 预训练类模型
- Bert
- Albert
- Roberta
- Distilbert
- Electra
- 非预训练类模型
- NLP菜鸟逆袭记——【多类别文本分类】实战
- NLP菜鸟逆袭记——【基于方面的情感分析(ABSA)】理论
- 基于方面的情感分析(ABSA) 实战篇
- NLP菜鸟逆袭记——【文本匹配】理论
- 文本匹配 实战篇
- 命名实体识别 理论篇
- 命名实体识别 实战篇
- NLP菜鸟逆袭记——【Bert-CRF】实战
- NLP菜鸟逆袭记——【Bert-Softmax】实战
- NLP菜鸟逆袭记——【Bert-Span】实战
- NLP菜鸟逆袭记——【MRC for Flat Nested NER:一种基于机器阅读理解的命名实体识别】实战
- NLP菜鸟逆袭记——【Biaffine NER:一种基于双仿射注意力机制的命名实体识别】实战
- NLP菜鸟逆袭记——【Multi Head Selection Ner: 一种基于多头选择的命名实体识别】实战
- NLP菜鸟逆袭记——【one vs rest NER: 一种基于one vs rest的命名实体识别】实战
- NLP菜鸟逆袭记——【GlobalPointer:一种基于span分类的解码方法】实战
- NLP菜鸟逆袭记——【W2NER:一种统一的命名实体识别词与词的的命名实体识别】实战
- NLP菜鸟逆袭记——【关系抽取(分类)】理论
- 关系抽取 实战篇
- 事件抽取 理论篇
- 事件抽取 实战篇
- 【NLP菜鸟逆袭记—【关键词提取】理论
- 关键词抽取 实战篇
- NLP菜鸟逆袭记—【新词发现】理论
- 新词发现 实战篇
- 【NLP菜鸟逆袭记—【实体链指】理论
- 实体链指 实战篇
- 【NLP菜鸟逆袭记—【知识图谱补全】理论
- 知识图谱补全 实战篇
- NLP菜鸟逆袭记—【对话系统】理论
- 对话系统 实战篇
- NLP菜鸟逆袭记—【Text-to-SQL】理论
- Text-to-SQL 实战篇
- NLP菜鸟逆袭记—【文本纠错】理论
- 文本纠错 实战篇
- NLP菜鸟逆袭记—【文本挖掘】理论
- 文本挖掘 实战篇
- NLP菜鸟逆袭记—【Bert 压缩】理论
- 知识蒸馏 实战篇
- PaddleSpeech 理论篇
- NLP菜鸟逆袭记—【Prompt】实战
- Prompt 实战篇
- NLP菜鸟逆袭记—【Embeddings】理论
- embedding 实战篇
- chaizi:一种 汉语拆字词典 神器
- cn2an:一种中文数字与阿拉伯数字的相互转换神器
- cocoNLP:一种 人名、地址、邮箱、手机号、手机归属地 等信息的抽取,rake短语抽取算法
- difflib.SequenceMatcher:一种 文本查重 神器
- Entity_Emotion_Express:一种 词汇情感值 神器
- jieba_fast:一种 中文分词 神器
- JioNLP:一种 中文 NLP 预处理 神器
- ngender:一种 根据名字判断性别 神器
- pdfplumber:一种 pdf 内容解析神器
- phone:一种 中国手机归属地查询 神器
- PrettyTable:一种 生成美观的ASCII格式的表格 神器
- Pypinyin:一种汉字转拼音神器
- Rank-BM25:一种 基于bm25算法 神器
- schedule :一种 最全的Python定时任务神器
- similarity:一种 相似度计算 神器
- SnowNLP:一种 中文文本预处理 神器
- Synonyms:一种中文近义词 神器
- textfilter:一种 中英文敏感词过滤 神器
- 一种 中文缩写库 神器