紀乃文 國立台灣大學土木工程學系電腦輔助工程組 博士後研究員 謝尚賢 國立臺灣大學土木工程學系教授兼工程資訊模擬與管理研究中心 主任 知識工程 有助統一資料格式 在資訊科技已與生活及工程密不可分的當代,資料的交換與溝通不管在哪一個領域都是重要且迫切的議題。尤其是「給電腦看」的資料必須以「機器可讀」的方式呈現,則更需要有統一的命名規則及資料交換標準,這就如同形形色色的生物常常具有不同的「俗名」,使得不同文化背景的人們難以將相同的指涉對象在不同的命名規則下聯想起來。但是生物學上的「學名」則徹底的解決了這個問題。任何一種生物也許會有非常多的俗名,卻只會有唯一的學名。 在建築資訊塑模(Building Information Modeling, BIM)的議題之上,雖然各式支援建築資訊模型的軟體及平台使得專案團隊可以充份的溝通及合作,但除了BIM的「平台」之外,團隊的參與人還必須具備BIM的「思維」,才能充份發揮出BIM的潛力。因而對於資料有統一的命名規則及交換標準,正是一個需要克服的長遠議題。近年來,「知識工程」(Knowledge Engineering)的勃發,大大地幫助了資料格式的解讀與統一,也開始應用到了BIM的領域上頭。
工業基礎類別IFC 資料交換標準 建築資訊模型當中,對於元件的描述方式,常建構於「工業基礎類別」(Industry Foundation Classes, IFC)[1] 之上,其由IAI(Industry Alliance for Interoperability)國際組織所提出,該組織建立於1994年(如今發展為BuildingSMART組織 [2]),成員包括了營建產業、繪圖與塑模軟體及資訊業界等領域。而其營運目的在於為營建相關產業制定標 準資訊格式,以減少資訊轉換的成本及耗損,在營建工程的生命週期當中達到資訊共享之目的 [3] 。而其所提出的IFC是一種開放性的資料格式,定義了從建築物的梁、柱、樓板、牆乃至於門、窗、傢俱、機電管線及元件等實質物件。而除了實質物件之外,IFC並有抽象的結構及程序等概念定義,因此可以應用在完整的營建工程生命週期。而使用了這個資料交換標準及命名規則的各式文件、資料庫便能夠彼此共享資料而加以整合。以Autodesk Revit為例,其可以輸出IFC格式的模型,作為和其他的BIM軟體溝通的媒介,而BIM與傳統的3D模型有所區隔,正是其對於「元件」的充份描述,對於傳統的3D模型而言,只能辨識出「量體」及其「邊界」之幾何資訊,但在建築資訊模型當中,可以知道其中何者是梁,何者是柱,何者是樓板,何者是牆,所憑藉的就是在建模的過程當中定義了幾何量體的屬性(Property),給予其確切的類別描述(即梁、柱、樓板、牆等等)。而IFC使得BIM軟體之間的「車同軌,書同文」成了可能。 知識本體興起 造就語意綱 概念然而,IFC只是一套擁有完整定義的「標準」,如果要能讓這套標準在電腦裡頭產生「自動化」的應用(比方說,能夠剖析以IFC標準寫成的檔案),就必須仰賴某種知識的「載具」來達成。知識本體(Ontology)便成了一種可能。「知識本體」乃是資訊領域當中人工智慧的重要議題。簡而言之,知識本體定義了知識的涵蓋範圍,描述知識涵蓋範圍裡的重要概念及屬性,並且建立概念與概念之間的關係,知識本體通常有固定的表達格式,使得其可以被圖型化,讓使用者能夠一目了然,更方便於各種應用程式作剖析(parse)。知識本體之所以在人工智慧領域扮演著重要的角色,是因為其能將既有的領域知識表達成「電腦可讀」(Machine Readable)的格式,繼而讓電腦能夠基於此知識庫發展各種有效的應用。而近年來,知識本體的興盛造就了「語意網」的概念被提出。 知識本體實作 實踐語意網 語意網(Semantic Web)的概念由網際網路之父Tim Berners Lee所提出,並且由國際知名的W3C(World Wide Web Consortium)機構 [4] 為其制定標準。它乃是繼網際網路的勃發之後所延伸的新興概念。在傳統的網際網路之網頁當中,網頁間的超連結(hyper link)往往提供這些網頁間相互關聯性的線索,但唯有經過人工解讀才能夠明瞭其關聯性究竟為何,如果只透過自動化的方式分析網頁間的互相連結關係,可謂「知其相關而不知其為何相關及如何相關」。尤其,對於文字內容歧異性之解析並沒有辦法單憑分析文字的本身來達到。舉一個最簡單的例子,詞彙「beam」在土木工程領域當中最經常是指向「梁」,但在物理光學的領域當中,它卻最常用來指涉「光束」,由這個簡單的例子可以說明,「梁」與「光束」都是詞彙「beam」的可能語意,而除非是極特殊的專有名詞,否則依照詞彙經常有一字多義的特性,詞彙本身常常難以精準解析語意。當「beam」這個詞彙出現在網頁內文當中的時候,我們要如何確認它的意義是「梁」還是「光束」?若由人為判讀,我們會依照我們的經驗法則來查看我們現在正在閱讀的文章屬於哪一個專業領域。但若要使這樣的判斷能夠被電腦自動執行,則勢必要針對「beam」這個詞彙加上其所屬於的專業領域之註解,方能正確解讀其意義。 而「語意網」這樣的概念,被以「資源描述架構」(Resource Description Framework, RDF)及「通用資源標誌碼」(Universal Resource Identifier, URI)兩種標準給實作出來。RDF以「可擴展標記式語言」(eXtensible Markup Language, XML)的格式來呈現,就如同我們日常生活當中所接觸到的網頁是由「超文本標記式語言」(HyperText Markup Language, html)所寫成,當我們從瀏覽器打開html網頁的時候,只會看到網頁的實質文字內容,卻不會看到裡頭用以指示瀏覽器如何「排版」的html標籤。又,html網頁所顯示的每張圖片,都不像我們所熟悉的word或是pdf文件一樣,是「內嵌」在文件當中,而是以「連結」的方式指示出圖片所存放的實際位址,再交由瀏覽器來解析並且展示圖片。這樣的概念大致就說明了RDF及URI是如何運作的,RDF裡所定義的標籤及相關說明,就如同不會顯示在瀏覽器上的html標籤一般,但它隱藏著能讓電腦解析出語意(就如同讓瀏覽器能解析出排版格式)的重要訊息。而URI便是指向任何既有參考連結的位址,我們所熟悉的http網址事實上就是URI的一種。 由上述說明便可以了解,RDF及URI可以在網頁訊息當中「埋藏」解析語意的方式及參考資源以供電腦解讀 [5, 6],延伸上述「beam」的例子,假設網路上存在「土木工程辭典」及「物理辭典」兩份RDF文件,則我們可以將一個提到了「beam」的網頁,利用html標籤裡允許埋藏「瀏覽器不會顯示的屬性」之特性,將RDF資訊內嵌於其中,並且把URI指向「土木工程辭典」。這麼一來,「beam」就不會錯誤地被解析為「光束」,而會被解析為「橋梁」了。而就算一篇文章當中是混雜著使用「光束」與「橋梁」,我們也可以為每一個beam詞彙的所在之處提供個別的RDF及URI資訊,讓它們都能被指向正確的語意。藉由這樣的操作,語意網提供了不同來源的資料間產生互相聯結的可能性。 而語意網與知識本體密切相關,RDF提供了定義「概念」、「屬性」及「關係」的方式,並允許建立概念之間的互相連結,儼然就是知識本體的良好載體。因此,網路知識本體語言(Web Ontology Language, OWL)便應運而生。OWL是基於RDF上所開發出來的一個子集合,其使用了RDF部份的類別來實作。或曰,一份OWL文件同時是一份合法的RDF文件,但一份合法的RDF文件卻未必是一份合法的OWL文件 [7]。但如果單純以存放知識本體為目的的話,RDF的要求稍顯繁複而難以實用。因此OWL總共有三個向下相容的衍生版本,是為OWL Full,OWL DL及OWL Lite,愈簡易的版本對於使用者而言愈容易實作,而OWL Lite被多數的研究者所採用,因為知識本體的「複雜度」會隨不同的研究領域及研究需求而異。通常僅為了儲存及定義「概念」、「屬性」、「關係」等重要元素時,OWL Lite已經堪用。 IFC與知識本體的共舞 ifcOWL竄起 在前面的段落,我們已經提到了知識本體的基礎概念及可能應用,然而,知識本體的相關研究一直存在一個重大的議題:想要建置「堪用」的知識本體並非易事。知識本體的建置過程往往和其應用方式密切相關。或者說,人們往往先有了一個特定的應用目的之後,才會依序定義知識表達的範圍,並將它反應在知識本體的概念及屬性之上。舉例來說,「人」擁有非常多可能的屬性,諸如身高、體重、血型、學歷、年齡、居住地…等等。當我們在填寫病歷表時,學歷便不是一個重要的資訊,而當我們在填寫求職履歷表時,血型便不是一個重要的資訊。但是基本上「病歷表」及「履歷表」都可以視為是用來描述一個「人」的知識載具,只是重視的點並不相同。試想:如果一份表格上帶有過多不重要的資訊,不僅造成建置及儲存上的負擔,更會使得檢視的人無法聚焦。這個例子就說明了「知識本體當中的概念所需建立的相關屬性」常常會綁定於特定的應用方式,就如同一個人在各種不同的場合所需填寫的個人資料,其欄位一定不會完全相同(也因此難以互相流用),是一樣的道理。在知識工程的實務上,研究人員往往是先從知識本體的應用方式定義了知識描述的範圍,並且略去了不重要的概念或屬性,才據以建立實用的知識本體。但是,為了讓知識能夠充份再利用,建置知識本體的過程常常會應用既有的知識本體作為基礎再往下發展(這又類似於:當我們在不同的場合填寫個資表格時,雖然欄位不盡相同,但共同的部份如果可以預先代入的話,便可省下不少心力與時間),又或者可能在知識本體的應用方式尚未明確之前,先就既有的可得資源來打造知識本體,以便後續應用的整合。 而建築資訊模型與知識本體的整合便屬於此類。IFC明確定義了在BIM模型當中可能會使用的元件及屬性,站在知識本體的角度來看,其實它就可以說是一個概念的集合。尤其,IFC擁有以XML格式呈現的範本,可說與基於OWL/RDF(RDF也是一種XML文件)具有共通的格式基礎而擁有極大的整合潛力。BuildingSMART機構於是建立了將IFC轉為OWL格式的標準流程與技術報告 [8],而提出了ifcOWL的概念 [9]。將IFC轉為可被語意網所囊括的資源。在結合了IFC及知識本體的背後,也大大拓展了BIM領域的應用可能。 參考文獻
0 評論
發表回覆。 |
文章類別
發佈時間
三月 2023
|