这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究由Isaac Joffe(阿尔伯塔大学电气与计算机工程系)、George Felobes、Youssef Elgouhari、Mohammad Talebi Kalaleh、Qipei Mei(通讯作者,阿尔伯塔大学土木与环境工程系助理教授)及Ying Hei Chui(阿尔伯塔大学教授)合作完成,发表于ASCE旗下期刊《Journal of Computing in Civil Engineering》2025年第39卷第4期,DOI: 10.1061/jccee5.cpeng-6037。
科学领域:本研究属于自然语言处理(NLP, Natural Language Processing)与土木工程的交叉领域,聚焦于利用大型语言模型(LLM, Large Language Model)解决建筑规范(Building Codes)的自动化问答问题。
研究动机:
1. 行业痛点:土木工程设计需严格遵循建筑规范,但人工检索规范条款耗时且易出错,尤其对初级工程师挑战显著。
2. 技术瓶颈:现有LLM(如ChatGPT)虽能完成通用问答,但在专业领域存在幻觉(Hallucination)问题,即生成虚假答案,且缺乏对技术条款的精准引用能力。
3. 研究空白:此前研究多依赖传统NLP技术(如语义角色标注、知识图谱),需人工干预且难以实现自然语言交互。
研究目标:
开发一个开源、可扩展的LLM框架,通过类ChatGPT的聊天机器人界面,为工程师提供精准、可溯源的规范问答服务,并以《加拿大国家建筑规范2020》(NBCC)为案例验证可行性。
目标:将原始规范文本转化为可检索的数据库。
- 步骤1:文本预处理
- 输入:NBCC的PDF文档(60238页)。
- 处理:通过正则表达式和自定义解析算法清除格式噪声(如多余空格、隐藏文本),保留纯文本内容,忽略图表。
- 挑战:PDF非结构化数据需文档特异性清洗(如分节符识别)。
步骤2:文档分块与标注
步骤3:搜索优化
核心架构:检索增强生成(RAG, Retrieval-Augmented Generation)框架,结合搜索与LLM生成能力。
- 步骤1:多模态检索
- 用户提问经预处理(去停用词、小写化)后,并行执行词法(BM25)与语义(Doc2Vec)搜索,返回Top-K相关文档块及引用位置。
- 实验数据:测试集显示BM25的Top-1准确率59%,优于Doc2Vec的32.7%(因测试问题与规范术语高度重合)。
搜索算法性能
LLM问答准确率
人工对比实验
科学价值:
1. 首次将RAG框架应用于建筑规范问答,解决了LLM在专业领域的幻觉与溯源问题。
2. 提出模块化设计,支持灵活替换搜索算法或LLM,适应技术迭代。
应用价值:
1. 效率提升:工程师可通过自然语言快速获取规范条款,减少80%检索时间。
2. 开源可扩展:全部代码公开,支持中小型企业低成本部署。
此报告系统梳理了研究的背景、方法、结果与创新点,为相关领域研究者提供了技术参考与应用启示。