摘要
针对以建筑信息模型(BIM)进行交付的信息共享模式所依赖的工业基础类(IFC)标准行业适用性不足且难以拓展的问题,探讨在IFC基础上引入语义网实现异源数据集成共享,并于语义层面实现信息交付。首先,通过算法解析和模型转化介绍语义化建模方法,并以二层钢框架厂房结构为例对该方法进行说明;然后,通过对转化案例进行数据模式分析,以验证建筑信息交付的准确性和建筑语义的可传递性。案例实践论证基于IfcOWL本体的语义化建模方法的可实施性;通过分析该语义化模型单元实例的数据模式,探究制约该语义化建模方法赋能建筑信息交付的关键因素;针对语义化建模方法所面临的问题,提出冗余信息规避、领域本体开发和轻量化语义建模的初步解决思路。SPARQL查询实例表明,所解析的数据模式对规避冗余信息有效。因此,该方法在共享和集成建筑多源异构信息方面具有优势,能有效提升建筑信息管理的智能化水平。
在推行数字化建造的过程中,项目各方信息流通困难、专业软件数据格式各异、建筑信息多源异构及大数据特征等问题严重阻碍了行业智能化转型。这些涉及信息集成、流通与管理的问题可统称为信息交付问题,而传统碎片化、分散式的交付方式已无法满足数字化建造需求,因此亟需革新建筑信息交付方式以打破信息孤岛壁垒。
建筑信息模型(Building Information Modeling,BIM)技术及其信息交付标准工业基础类(Industry Foundation Class,IFC)的兴起为上述问题带来了转机。IFC是由buildingSMART International(bSI)提出的开放且中立的数据交换格式,其通过描述建筑模型的几何架构、语义架构以及二者的相互关系,实现了对建筑信息的完整描述。也正因如此,IFC被认为适用于建筑全生命周期中的大部分数据交换场景。例如,刘照球
此外,通过建立数学表达式或开发算法来建立数学模型的方法也是一种可行的数据集成方式,比如魏国海
针对以上问题,笔者在IFC标准基础上引入语义网以克服其局限性。首先,介绍语义网核心技术架构,并分析语义网拓展IFC功能的可行性。然后,利用Pauwels
语义网是万维网之父Berners-Lee
Berners-Lee最早提出了语义网基本架构,其逐步发展完善为现行的语义网堆
RDF是万维网联盟(World Wide Web Consortium,W3C)提出的以相互关联的有向标记图描述资源信息的标准框架。通过以主体-谓词-客体的三元组表达式描述资源,实现对多源异构数据的统一表达,进而为语义化建模和知识查询推理奠定数据基础。
本体和OWL是语义网体系中赋予模型高级知识逻辑的关键模块。本体原为哲学领域概念,知识工程引入该术语以创建自动推理信息模型。OWL特指W3C推行的OWL2网络本体语言,是一种旨在表述事物、事物组及事物间关系所蕴含知识的陈述性语言。在语义网架构中,把基于OWL概念创建的RDF图称为OWL本体,用以弥补RDFS(Resource Description Framework Schema)语义丰富度不足的缺陷。

图1 OWL2本体分类及语义层次关系
Fig. 1 Classification and semantics hierarchy relationships of OWL2 ontology
SPARQL是基于图模式匹配的RDF查询语言,可跨数据源作联合查询并返回RDF图。SPARQL可对匹配图模式作增删查改,进而实现RDF数据集的动态更新。除查询外,知识推理也是语义网的重要功能。语义网不仅有源自RDFS和OWL的推理逻辑,还可借由SWRL、SPIN和SHACL规则语言实现高级知识推理。此外,辅助本体开发的本体推理也是一种知识推理形
在实际信息交付场景中,IFC标准所面临的主要问题是数据模式难以拓展和信息提取修改困难。通过分析各问题致因以及语义网处理该问题的优势,论证了语义网拓展IFC信息交付功能的可行性。
拓展性问题是指难以扩充既定的IFC数据模式来满足个性化的信息表述需求,该问题主要源于定义数据模式的EXPRESS语言。首先,这是一种不常用的声明性语言,难以被建筑业用户所掌握;其次,该语言可定义的信息类型繁杂(可同时定义实体、关系、规则及复杂数据结构),故由其声明的IFC数据模式复杂且难以扩展。bSI针对该问题提供了自定义属性集和数据字典的解决方案,但前者难以实现术语对齐,后者缺乏灵活性而无法提供有效帮助。语义网能够集成本体和描述逻辑对各领域信息进行个性化知识表示,然后依托本体映射实现语义层面的一致性匹配,进而将IFC兼容信息与其他信息进行统一表达。因此,语义网技术可有效解决IFC标准面临的拓展性难题。
IFC标准的另一个问题是缺乏高效的信息查改方法。IFC-SPF文件是基于IFC数据模式编写的纯文本文件,该文件不仅可读性差,而且难以对IFC语句进行修改。Mazairac
除以上优势外,语义网的知识推理功能有助于高效利用建筑信息。在项目管理过程中,所集成数据增多,隐含知识也随即陡增。而挖掘隐含知识对于开发项目管理服务是有益的。如,Wu
鉴于在IFC模型基础上进行语义化建模,故对IFC模型的生成方式和信息转化效率进行分析。
模型视图定义(Model View Definition,MVD)是对BIM模型作数据筛选输出IFC模型的过滤器。其兴起的原因在于随着BIM信息交付所涉及领域的不断扩张,IFC标准面向不同专业的数据冗余问题愈发突出,因此,bSI推出MVD作为IFC标准的子集以适应不同应用需求。
bSI在其MVD数据库收录了MVD的所有可用版本,而在建筑业BIM软件中得到应用的分别是IFC 2×3协调视

图2 双层钢框架厂房BIM模型结构示意
Fig. 2 BIM model of two-story steel frame building
为对比经不同MVD输出IFC模型的数据转化效率,选取如
MVD名称 | 实体总数 | 关系总数 | 实体类型 | 材料关系 | 属性关系 | 类型关系 | |
---|---|---|---|---|---|---|---|
CV 2.0 | 149 | 476 | 3类 | 2 | 429 | 21 | |
参照视图 | 建筑 | 149 | 620 | 3类 | 2 | 574 | 36 |
结构 | 132 | 537 | 2类 | 1 | 509 | 20 | |
建筑服务 | 149 | 620 | 3类 | 2 | 574 | 36 | |
设计传递视图 | 149 | 764 | 3类 | 146 | 574 | 36 |
针对该案例的楼板信息转化结果,进一步对比各输出模型转化效率。楼板采用压型钢板-混凝土组合楼板,Revit建模时采用双层组合形式。在楼板的信息转化过程中,参照视图与CV 2.0只能将其简化为单层混凝土构件;并且前者还缩减了楼板的实体关系,尤其是材料关系的输出,导致建筑信息严重丢失。而设计传递视图对于组合楼板的信息转化效果明显优于前述视图,该视图不仅有效保留了构件应有的实体关系,还能将组合楼板以双层形式正常输出。因此,设计传递视图输出模型在保真度和信息丰富度方面有明显优势。
语义化建模旨在以RDF对IFC实体信息作资源虚拟化。针对此转化需求,Karan
对于已开发的IfcOWL本体而言,IFC4对应本体相较于IFC 2×3对应本体在类层次关系及公理数目上更具优越性,再结合前文各IFC模型的转化效果,最终选定设计传递视图输出模型进行语义化建模。建模步骤分为IFC-SPF文件向Turtle文件转化和引入IfcOWL本体实现高阶语义赋能。在JDK17的编译环境中启动转换器并执行文件转化,然后将初始RDF模型导入Protégé本体编辑器,最后用IfcOWL本体为该模型赋予建筑语义内涵。
为明晰转换器的工作原理,通过IntelliJ IDEA将其运行于maven项目,并对其转化机制作源码分析。如

图3 IFCtoRDF-0.4转换器运行流程
Fig. 3 Flow chart of IFCtoRDF-0.4 converte
转换器执行文件转化的核心步骤包括参考标准导入、IFC语句解析和三元组编写。在设置模块中,通过反序列化IFC标准的序列化文件导入参考标准;在转化模块加粗蓝框标识步骤中,调用 parseIfcLineStatement( )解析IFC语句;三元组则在转化模块不同步骤中根据其类别调用特定方法予以编写。为分析语句解析的基本逻辑,绘制如

图4 转化模块关键算法的运行逻辑
Fig .4 Execution logic of key algorithms in convert module
(a) IFC语句解析算法的伪代码 (b) 字符串分支属性转化算法的伪代码
IFC语句对应三元组主要源于属性信息的转化,如
利用此转换器输出双层钢框架厂房的初始RDF模型并导入Protégé应用程序,由于转化过程已基于Apache Jena框架实现本体类的注册,故可引入IfcOWL完成建筑语义赋能。
为探讨基于IfcOWL语义化建模方法未得到有效使用的可能原因,对语义化模型单元实例的数据模式进行分析。鉴于RDF模型数据模式的通用性,此内容也将为建筑信息的知识存取与逻辑推理研究提供技术参照。
建筑单元实例是指具体构件的实例对象。

图5 RDF模型中建筑单元的类继承关系
Fig. 5 Class hierarchy relationships of building elements in RDF model
在RDF模型中,建筑单元实例的语义化描述均由

图6 构件实例对象的属性架构
Fig. 6 Object property schema of building elements
梁柱单元是钢框架结构主要的构件形式,因此,选取

图7 IfcBeam_4072对象布置属性数据模式
Fig. 7 Object placement property schema of IfcBeam_4072

(a) IfcBeam_4072几何表示属性数据模式总体架构

(b) RDF资源ShapeRepre_3901的数据模式

(c) RDF资源ShapeRepre_3888的数据模式
图8 IfcBeam_4072几何表示属性数据模式
Fig. 8 Representation property schema of IfcBeam_4072
在建立的钢框架语义化模型中,柱单元的数据模式与梁单元具有相似性。柱单元对象布置属性数据模式的分析结果表明,IfcColumn_421的局部坐标系与结构整体坐标系一致,原点的绝对坐标为(-16 800, 6 300, 0)。

图9 IfcColumn_421几何表示属性数据模式
Fig. 9 Representation property schema of IfcColumn_421
对于项目信息管理而言,几何表示属性中由IfcGeometricRepresentationContext及其子类实例描述的背景信息是冗余的。以

图10 几何表示实体中背景信息的数据模式
Fig. 10 Schema of geometric representation context
为SPARQL语句设立精确图模式可有效规避冗余信息。比如,可为梁柱单元及其拉伸长度查询设立如下SPARQL语句:
SELECT ?element ?depth WHERE{
?element (((((representation/ representation)/
hasContents)/ items)/ mappingSource)/ items)/
depth ?depth
}
上述语句对谓词属性进行了简写,即省略了谓词的前缀与后缀。依据此精确图模式匹配,便能有效规避冗余信息。此外,基于此精确图模式编写DELECT语句可移除用户不需要的冗余信息。笔者将此技术应用到所开发的SemBIMCURD-SJTU软件中。
通过以上对单元实例的对象布置和几何表示属性数据模式的分析,语义化模型对于建筑信息交付的准确性和建筑语义的可传递性得到验证。但不容忽视的是,采用的基于IfcOWL的语义化建模方法仍然存在弊端。具体来说,IfcOWL完全复现了IFC标准,这使得所建立的语义化模型数据模式复杂,并且存在大量冗余信息。此外,引入IfcOWL本体作语义赋能后的语义化模型体量较大,难以发挥该模型在知识查询与推理方面的优势。
通过案例分析验证了语义化模型进行建筑信息交付的数据准确性和语义可传递性,进而论证了该建模方法的可行性。此外,通过对所转化模型数据模式进行建筑内涵分析发现,于IfcOWL的语义化建模方法尚未在建筑业全面推广有如下原因:
1)建筑业通用本体不够完善,IfcOWL本体数据模式完整继承了IFC标准,这种复杂的数据层次关系制约了模型知识查询与推理功能的实践。
2)IFC模型向RDF模型转化数据冗余现象突出,完全转译IFC模型信息的语义化建模手段信息传递效率较低。
3)建筑项目的信息管理具有大数据特征,对所有建筑信息执行该语义化建模的经济性和可行性不足。
针对上述问题,除本文提及的冗余信息规避方法外,还可以结合语义化模型各模块的建筑信息内涵,通过领域本体开发和轻量化语义建模来实现高效的信息表达和交付,进而将该技术推广实践于安全风险分析、建筑性能管理和数字孪生建模等涉及异源数据集成的应用领域。
参考文献
刘照球, 李云贵, 吕西林, 等. 基于BIM建筑结构设计模型集成框架应用开发[J]. 同济大学学报(自然科学版), 2010, 38(7): 948-953. [百度学术]
LIU Z Q, LI Y G, LU X L, et al. BIM-based integrated information framework for architectural and structural design model [J]. Journal of Tongji University (Natural Science), 2010, 38(7): 948-953. (in Chinese) [百度学术]
赖华辉, 邓雪原, 刘西拉. 基于IFC标准的BIM数据共享与交换[J]. 土木工程学报, 2018, 51(4): 121-128. [百度学术]
LAI H H, DENG X Y, LIU X L. IFC-based BIM data sharing and exchange [J]. China Civil Engineering Journal, 2018, 51(4): 121-128. (in Chinese) [百度学术]
马智亮, 滕明焜, 任远. 从BIM模型提取建筑能耗监测静态数据的方法[J]. 哈尔滨工业大学学报, 2019, 51(12): 187-193. [百度学术]
MA Z L, TENG M K, REN Y. Method of extracting static data for building energy consumption monitoring from BIM [J]. Journal of Harbin Institute of Technology, 2019, 51(12): 187-193. (in Chinese) [百度学术]
PAUWELS P, ZHANG S J, LEE Y C. Semantic Web technologies in AEC industry: A literature overview [J]. Automation in Construction, 2017, 73: 145-165. [百度学术]
魏国海, 刘才玮, 曹永升, 等. 钢筋混凝土梁火灾损伤的多元信息融合模型[J]. 土木与环境工程学报(中英文), 2022, 44(6): 153-161. [百度学术]
WEI G H, LIU C W, CAO Y S, et al. Multi-information fusion model for fire damage of reinforced concrete beam [J]. Journal of Civil and Environmental Engineering, 2022, 44(6): 153-161. (in Chinese) [百度学术]
LIU Z S, SHI G L, ZHANG A S, et al. Intelligent tensioning method for prestressed cables based on digital twins and artificial intelligence [J]. Sensors, 2020, 20(24): 7006. [百度学术]
张立奎, 段大猷, 王佐才. 基于LSTM神经网络的多源数据融合桥梁变形重构方法[J]. 土木与环境工程学报(中英文), 2022, 44(3): 37-43. [百度学术]
ZHANG L K, DUAN D Y, WANG Z C. A multi-source data fusion method for bridge displacement reconstruction based on LSTM neural network [J]. Journal of Civil and Environmental Engineering, 2022, 44(3): 37-43. (in Chinese) [百度学术]
PAUWELS P, TERKAJ W. EXPRESS to OWL for construction industry: Towards a recommendable and usable ifcOWL ontology [J]. Automation in Construction, 2016, 63: 100-133. [百度学术]
BERNERS-LEE T, HENDLER J, LASSILA O. The Semantic Web [J]. Scientific American, 2001, 284(5): 34-43. [百度学术]
International BuildingSMART. BuildingSMART - Technical Roadmaps [EB/OL]. [2023-03-02]. https://www.buildingsmart.org/about/technical-roadmap/. [百度学术]
GILCHRIST A, ZENG M L, CLARKE S D, et al. Logic and the organization of information - an appreciation of the book of this title by Martin Frické. A set of short essays [J]. Journal of Information Science, 2013, 39(5): 708-716. [百度学术]
W3Working GroupC OWL. OWL2 web ontology language document overview (second edition) - W3C Recommendation, 11 December, 2012 [EB/OL]. [2023-03-02]. https://www.w3.org/TR/owl2-overview/. [百度学术]
Schneider M. OWL 2 web ontology language RDF-based semantics (second edition)-W3C recommendation, 11 December, 2012 [EB/OL]. [2023-03-02]. https://www.w3.org/TR/2012/REC-owl2-rdf-based-semantics-20121211/. [百度学术]
HU Z Z, LENG S, LIN J R, et al. Knowledge extraction and discovery based on BIM: A critical review and future directions [J]. Archives of Computational Methods in Engineering, 2022, 29(1): 335-356. [百度学术]
MAZAIRAC W, BEETZ J. BIMQL - An open query language for building information models [J]. Advanced Engineering Informatics, 2013, 27(4): 444-456. [百度学术]
KRIJNEN T, BEETZ J. A SPARQL query engine for binary-formatted IFC building models [J]. Automation in Construction, 2018, 95: 46-63. [百度学术]
WU H T, ZHONG B T, LI H, et al. Combining computer vision with semantic reasoning for on-site safety management in construction [J]. Journal of Building Engineering, 2021, 42: 103036. [百度学术]
KARAN E P, IRIZARRY J, HAYMAKER J. BIM and GIS integration and interoperability based on semantic web technology [J]. Journal of Computing in Civil Engineering, 2016, 30(3): 04015043. [百度学术]
RASMUSSEN M H, LEFRANÇOIS M, SCHNEIDER G F, et al. BOT: The building topology ontology of the W3C linked building data group [J]. Semantic Web, 2021, 12(1): 143-161. [百度学术]
BONDUEL M, ORASKARI J, PAUWELS P, et al. The IFC to linked building data converter: Current status[C]//6th linked data in architecture and construction workshop. 2018: 34-43. [百度学术]
NIKNAM M, KARSHENAS S. A shared ontology approach to semantic representation of BIM data [J]. Automation in Construction, 2017, 80: 22-36. [百度学术]
PAUWELS P, KRIJNEN T, TERKAJ W, et al. Enhancing the ifcOWL ontology with an alternative representation for geometric data [J]. Automation in Construction, 2017, 80: 77-94. [百度学术]