当代日本名字中的性别特征

分享自：
当代日本名字中的性别特征

期刊:Digital Scholarship in the HumanitiesDOI:10.1093/llc/fqae022
这篇文档属于类型a，即报告了一项原创研究。以下是针对该研究的学术报告：
研究作者与机构
 本研究由Ivona Barešová、Tereza Nakaya和Vladimír Matlach共同完成。Ivona Barešová和Tereza Nakaya来自捷克共和国帕拉茨基大学（Palacký University Olomouc）的亚洲研究系（Department of Asian Studies），Vladimír Matlach则来自同一大学的普通语言学系（Department of General Linguistics）。该研究于2024年发表在《Digital Scholarship in the Humanities》期刊上。
学术背景
 本研究的主要科学领域是语言学，特别是日本名字的性别特征分析。研究背景基于以下事实：日本名字在形式上具有极大的多样性，且没有严格的法律限制，但其语音和字形特征通常能够反映出名字持有者的性别。尽管日本名字并不强制要求标明性别，但通过分析名字的语音、字形等特征，通常可以推测出性别。20世纪末，日本命名实践发生了显著变化，传统的性别化命名模式逐渐减少，取而代之的是更多样化的名字。因此，本研究旨在通过统计分析名字的长度、音节、特定位置的字符以及所使用的文字类型等特征，探讨这些特征是否与男性或女性名字显著相关，并确定哪些特征对性别表达贡献最大。
研究目标
 本研究的主要目标是验证一些特征在性别标记上的经验知识，并为未来基于特征的性别预测算法奠定基础。此外，研究还探讨了20世纪末命名实践和名字选择的主要变化背景下，当代日本名字中性别表达的方式。
研究流程
 研究流程主要包括以下几个步骤：
数据收集
 研究数据来源于日本育儿网站“Baby Calendar”，该网站提供了2008年至2022年出生的15,058个婴儿的名字信息，包括名字的书写形式（图形形式）、发音形式（语音形式）、授予年份、名字持有者的性别以及名字选择的故事。数据经过手动检查和预处理，最终形成了包含不同图形形式和语音形式的数据集。
特征定义
 研究分析了多个与性别相关的名字特征，包括名字长度、特定位置的符号（字符或音节）以及文字类型（汉字、平假名、片假名等）。名字的语音长度以“拍”（mora，日语中的基本语音单位）计算，而图形长度则以字符数量计算。
统计分析方法
 研究使用卡方检验（Chi-square test）和Fisher精确检验（Fisher’s exact test）来分析名字特征与性别之间的关联。具体步骤包括：
首先，通过卡方检验分析某一特征在男性和女性名字中的使用是否存在显著差异。
如果存在显著差异，则进一步使用Fisher精确检验来确定该特征与男性或女性名字的具体关联。
此外，研究还使用逻辑回归（Logistic regression）分析名字长度与性别之间的关系。
数据分析
 研究对名字的语音形式和图形形式分别进行了分析，重点关注名字的长度、初始符号、末尾符号以及文字类型。具体分析包括：
名字长度：分析语音长度和图形长度与性别的关系。
语音形式：分析初始音节、末尾音节以及末尾两音节的性别关联。
图形形式：分析初始汉字、末尾汉字以及文字类型的性别关联。
语音与图形形式的结合：分析末尾音节与末尾汉字的组合对性别表达的影响。
主要结果
 研究的主要结果如下：
名字长度
语音长度为2和3拍的名字显著与女性名字相关，而长度为4至6拍的名字显著与男性名字相关。
图形长度为3个字符的名字显著与女性名字相关，而长度为1至2个字符的名字与男性名字相关。
语音形式
初始音节中，某些重音节（如/ryu/、/ke/、/sho/等）显著与男性名字相关。
末尾音节中，/ke/、/ga/、/ta/等音节显著与男性名字相关，而/ka/、/na/、/ko/等音节显著与女性名字相关。
末尾两音节中，/rō/、/suke/、/sei/等音节显著与男性名字相关。
图形形式
初始汉字中，龙、煌、健等汉字显著与男性名字相关，而结、咲、心等汉字显著与女性名字相关。
末尾汉字中，郎、大、朗等汉字显著与男性名字相关，而子、花、菜等汉字显著与女性名字相关。
文字类型中，平假名和片假名的使用显著与女性名字相关。
语音与图形形式的结合
末尾音节与末尾汉字的组合对性别表达的影响最为显著。例如，/rō/与“郎”组合显著与男性名字相关，而/ka/与“花”组合显著与女性名字相关。
结论
 本研究的结论表明，当代日本名字的性别表达主要通过名字的末尾音节和末尾汉字来实现。此外，名字的长度和文字类型也在性别表达中起到了重要作用。研究结果为未来的性别预测算法提供了坚实的理论基础，并为进一步研究日本名字的性别特征提供了新的视角。
研究的意义与价值
 本研究的科学价值在于通过统计分析验证了日本名字中性别标记的经验知识，并为未来的性别预测算法提供了数据支持。此外，研究还揭示了20世纪末日本命名实践的变化对性别表达的影响，为语言学和社会学领域的研究提供了新的见解。
研究亮点
 本研究的亮点包括： 1. 使用了大规模的数据集（15,058个名字），涵盖了多种名字形式。 2. 通过统计分析揭示了名字长度、音节、汉字等特征与性别之间的显著关联。 3. 提出了语音形式与图形形式结合的性别表达模型，为未来的研究提供了新的方向。
这篇报告详细介绍了研究的背景、方法、结果和意义，为其他研究者提供了全面的参考。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问