搜尋結果
再对其进行性别、年龄、拼音、情感、人名指数等标记,最终形成5600万+的中文人名图谱。 本子项目可用于中文分词、人名识别等场景。 PS1:维护此项目,除个人兴趣外,主要是在此过程中,可通过任务驱动来不断学习和实践NLP、KG以及AI等相关前沿技术。
只删词,不加词。 可用于中文分词、人名识别。 中文常见人名(Chinese_Names_Corpus) 120万。从亿级人名语料中提取。删除了罕见姓氏、和带生僻字的人名。随机删除了部分名人姓名(一点点小私心)。 中文古代人名(Ancient_Names_Corpus) 25万。多个
中文姓氏拼音字典收集了1606条中文姓氏及其拼音。 其中1534条姓氏及其注音抓取自 名霸百家姓,剩下的72条则见于本语料库的具体语例,并由我自己手动注音,包括:滕, 刁, 牧, 欧阳, 徐离, 傲, 宾, 博, 采, 恩, 凡, 格, 冠, 好, 昊, 浩, 荷, 恒, 鸿, 湖, 化, 基, 继, 见, 杰, 静, 菊, 俊, 卡, 科, 奎, 立, 丽, 刘付, 绿, 麦, 曼, 美, 梦, 名, 默, 沐, 娜, 乃, 尼, 日, 如, 润, 若, 上, 升, 桃, 天, 拓, 旺, 未, 溪, 夏候, 湘, 晓, 雄, 雅, 岩, 彦, 艳, 依, 远, 悦, 忠, 珠。 中文姓氏博大精深。
2024年3月27日 · 通过分词工具对海量文本进行分词和词频统计。数据清洗后,得到千万级的人名词典。再对其进行性别、年龄、拼音、情感、人名指数等标记,最终形成5600万+的中文人名图谱。 本子项目可用于中文分词、人名识别等场景。
中文人名语料库(Chinese-Names-Corpus). 关于萌名(NameMoe). 萌名是一个基于大数据和自然语言处理技术的新取名产品。. 通过分词工具对海量文本进行分词和词频统计。. 数据清洗后,得到千万级的人名词典。. 再对其进行性别、年龄、拼音、情感、人名指数等标记 ...
取名字典整理了适合起名的中文汉字27941个汉字,覆盖6000个寓意好的中文汉字,并将汉字进行了人性化的归类,方便您在取名的时候,随时随地的查阅。
新华字典在线查字收录简体汉字、繁体汉字共8万多个,提供查询汉字的拼音、笔画、部首、五笔86/98编码、仓颉、郑码、电码、汉字笔顺编号、四角号码、UNICODE、汉字方言、汉英互译、词性变化、康熙字典解释、说文解字、英文等汉字的详细解释。. 在字典查询 ...