CAD의 다크 데이터를 마이닝하여 디지털 트윈 구축
엔지니어링 소프트웨어 개발 회사의 CAD에서 GIS로의 전환 이니셔티브가 직면한 주요 과제 중 하나를 해결한 방법.
공유
카테고리: 엔터프라이즈 엔지니어링
Gavin Schrock이 작성한 이 글은 GoGeomatics에 게재되었습니다
2023년 11월 10일
이론적으로, 엔지니어링 도면에서 특징을 추출하여 GIS를 채우고 증강하는 것은 매우 직관적인 제안입니다. 하지만 현실적으로 이를 실행하기는 쉽지 않습니다. 레벨(또는 레이어)과 셀(또는 블록)로 구분되는 CAD 도면의 선과 기호가 관련성 있는 공간 참조 프레임워크에 표시된다면 GIS 스키마로 원활하게 변환될 수 있을까요? 흔히 악마는 디테일에 있다고 말하지만, 레거시 CAD의 경우 디테일을 인식하지 못하는 것이 악마일 수 있습니다.
Phocaz Inc.의 최고 기술 책임자인 Mark Stefanchuk은 "CAD 표준의 중요한 점은 CAD 표준이 항상 엄격하게 지켜지지 않고 진화한다는 것입니다. 예를 들어, 2000년 이전에는 레벨에 번호가 매겨졌고, 나중에는 레벨 이름으로 발전했습니다. 설계자들은 특히 급할 때 CAD 표준을 사용하지 않는 경향이 있습니다. 셀을 선, 원, 상자 텍스트 등과 같은 기본 요소로 떨어뜨리거나 셀을 그룹화하여 우리가 유지하고자 하는 속성을 잃게 되는 상황에 직면했습니다."라고 말합니다.
계약된 설계 회사와의 단절, 다른 표준을 요구하는 자금 지원 프로젝트, 레벨/셀 명명 스키마에 대한 기존의 통념이 진화하고 있습니다. 예를 들어, 일부 엔지니어링 기관에서는 순수하게 설계 특징과 준공 특징(또는 기록 도면)을 구분하기 위해 표준을 확장했습니다. Stefanchuk는 "CAD 표준을 다시 발전시켜야 한다면 오래 전에 존재했던 것에서 현재 존재하는 것, 그리고 미래에 원하는 것으로 나아갈 수 있는 수단을 개발해야 합니다. 이는 거의 모든 조직에서 일어나는 일이며, 어떤 조직은 다른 조직보다 표준을 더 잘 통제하고 있습니다. 물론, 예를 들어 교통부 고객들은 프로젝트마다 사람들이 셀을 분해하거나 폭발시키는 이상 징후가 나타나기도 합니다."라고 말합니다.
다크 데이터
Phocaz Inc.의 창립 파트너이자 CEO인 Mary A. Ramsey는 "CAD-GIS 이송에 대해 논의할 때 자주 제기되는 질문 중 하나는 왜 레거시 데이터로 작업하려고 하느냐는 것입니다."라고 말합니다.
"우리와 우리 고객의 생각은 레거시 데이터를 가지고 있는 사람이라면 누구나 처음에 데이터를 확보하기 위해 상당한 금액, 심지어 수백만 달러를 투자했다는 것입니다. 수십 년에 걸쳐 CAD 기록을 생성하는 것은 엄청난 투자가 될 수 있으므로 최소한 이러한 기록에서 최대한 많은 정보를 얻으려고 노력하는 것이 합리적입니다."
"교통부(DOT)의 경우, 이는 납세자의 세금이 들어간 것입니다. 이러한 디지털 자산에 상당한 투자가 이루어졌으므로 이제 더 많은 보상을 얻을 수 있어야 합니다. 따라서, 당연히 그 안에 있는 데이터 분석을 시작해야 합니다. 레벨이나 셀 이름과 같이 자동으로 추출할 수 없는 것을 '다크 데이터'라고 합니다. 하지만 그것은 기하학적인 그림입니다. 완전히 추출할 수 있다면 얻을 수 있는 가치를 상상해 보십시오." 인프라의 다크 데이터는 뜨거운 주제입니다. 인프라 측면에서 다크 데이터는 진화하는 데이터 관행, 표준 준수 부족, 기관 지식에 대한 과도한 의존, 부실한 데이터 관리로 인해 쉽게 액세스할 수 없는 귀중한 데이터를 의미하며, AI는 이를 마이닝하는 새로운 방법을 가능하게 합니다. 이것이 바로 Phocaz가 교통 부문 고객의 CAD 아카이브에서 다크 데이터를 마이닝하기 위해 취한 접근 방식입니다.
또 다른 질문은 "왜 모바일 매핑과 드론은 안 될까요?"입니다. 모바일 매핑과 드론 기반 데이터 캡처는 최근 몇 년 동안 눈부시게 발전해 왔습니다. 정밀도, 위치 정확도, 특징 인식 자동화, 간소화된 현장 작업의 발전이 이루어졌습니다. 하지만 수만 마일에 달하는 고속도로를 캡처하려면 현실적으로 수백만 달러의 비용이 들며, 그럼에도 불구하고 이러한 기술이 모든 특징을 캡처할 수는 없습니다. 수십 년간 축적된 CAD 설계 및 기록 도면의 매몰 비용은 엔터프라이즈 GIS(디지털 트윈으로 진화하는)를 실질적으로 채우고 보강하는 데 활용할 수 있는, 잠재적으로 비용 효율적인 리소스로 주목받고 있습니다.
생산성 향상
Ramsey는 "우리는 주로 컴퓨터 지원 설계 분야를 위한 소프트웨어 개발 서비스를 제공하기 위한 수단으로 Phocaz를 시작했습니다. 특히 토목 엔지니어링 사용자를 위해 Civil 3D, Bentley MicroStation 및 OpenRoads(물론 당시에는 InRoads였을 것입니다) 등이 있습니다. 우리는 기본적으로 해당 플랫폼과 기본 제품에서 실행되는 고객을 위한 애드인을 개발하고 유지 관리하고 있었습니다. 우리는 오늘날에도 이러한 유형의 작업을 계속하고 있으며, 해당 라인을 따라 교통부 및 기타 인프라 고객을 위해 많은 작업을 수행하고 있습니다."라고 말합니다.
오랜 고객인 조지아 교통부(GDOT)가 CAD 파일에서 데이터를 수집하고 추출을 자동화하여 이를 엔터프라이즈 GIS에 넣을 수 있도록 해달라는 요청에 Phocaz는 CAD-to-GIS 솔루션을 제안했습니다. 이것이 바로 GDOT가 CLIP이라고 부르는 "CAD 레벨 통합 프로세스"의 기원입니다. Phocaz는 먼저 이 작업을 수행하도록 설계된 기존 도구, 심지어 CAD 환경 내에서도 일부 도구를 확인했습니다. "우리는 이러한 프로세스가 다소 느리고, DOT에서 마이닝하고자 하는 CAD 아카이브의 방대한 양을 고려할 때 실용적이지 않다는 사실을 금방 알게 되었습니다. 생산 관리 방법과 이러한 작업으로 인해 생성되는 엄청난 양의 데이터는 말할 것도 없습니다."
이 솔루션은 GDOT 및 다른 대규모 인프라 고객의 요구 사항을 충족할 수 있도록 확장 가능해야 했습니다. Stefanchuk은 "예를 들어, GDOT는 80,000개의 중앙 차선 마일과 연방 지원 경로를 관리합니다. 이는 주 내 고속도로 도로의 약 1/3에 해당하며, 아마도 250,000마일에 가까울 것입니다." 조지아 주만 고속도로 CAD 파일을 그렇게 많이 "마이닝"할 수 있는 기회(그리고 과제)를 가지고 있는 아닙니다. 50개 주의 총 차선 마일을 살펴보십시오. Phocaz는 AI 기반 알고리즘 개발을 시작하고 디지털 트윈 접근 방식을 채택했으며 생산 및 데이터 관리를 위해 벤틀리시스템즈의 ProjectWise를 활용했습니다.
가상 로봇 자동차
처음에는 단순히 CAD 도면을 스캔하여 레벨과 셀 이름으로 인식할 수 있는 특징을 찾아내는 것이 목표였습니다. 하지만 단순히 "디지털 차선을 주행"하고 특징을 종합적으로 추출하는 것이 더 효과적이었습니다.
AI가 차선을 따라 진행하면서 도면을 검토하고 이동하면서 특징을 캡처하는 개념이었습니다. LiDAR/이미징 모바일 매핑이 장착된 차량으로 각 차선을 운전하는 것과 거의 비슷하지만 비용은 훨씬 저렴합니다. 하지만 AI 자동차가 여정을 시작하려면 먼저 일관된 공간 환경이 존재해야 합니다. 다행히도 Stefanchuk이 언급했듯이 CAD의 설계 접근 방식은 모델에서 작업하고 참조를 가져온 다음 그로부터 시트를 잘라내는 것이었습니다. 따라서 거의 모든 경우에 도면을 "드라이브"할 준비가 되었습니다. DGN(MicroStation) 환경에서 작업하는 DOT 고객의 경우, 벤틀리의 ProjectWise를 선택하는 것이 도면, 추출 진행률 및 결과 데이터를 관리하는 데 특히 적합하다는 것이 입증되었습니다.
향후 애플리케이션
CAD 표준을 다시 발전시켜야 한다면 오래 전에 존재했던 것에서 현재 존재하는 것, 그리고 미래에 원하는 것으로 나아갈 수 있는 수단을 개발해야 합니다.
—Mark Stefanchuk
ProjectWise는 벤틀리시스템즈의 프로젝트 관리 제품군으로 다양한 분야와 형식, 전체 프로젝트 수명 주기에 걸쳐 데이터의 허브 역할을 할 수 있으며 디지털 트윈 환경에서 작업을 가능하게 합니다. 많은 교통 부문 고객이 주로 벤틀리 환경(예: DGN 및 MicroStation, 관련 설계 소프트웨어 패키지)에서 작업하므로 이 제품군에서 CLIP 프로젝트를 관리하는 것이 합리적이었습니다.
Stefanchuk은 "우리가 로봇 자동차라고 부르는 CLIP 자동차는 알고리즘에서 어떤 일이 일어나고 있는지 이해하기 위해 시각화된 세션 도구입니다. 최종 사용자는 이를 절대 볼 수 없습니다. 그래도 로봇 자동차의 시연을 보는 것은 재미있었습니다. 결국 그들이 원하는 것은 GIS 환경 내 특성의 중심선 그래픽과 이에 할당된 속성입니다."라고 말합니다.
고속도로를 따라 특정 지점에서 이러한 속성이 무엇인지 알아내기 위해 Phocaz는 이러한 특징을 살펴보고 찾을 수 있는 도구를 개발했습니다. AI는 자전거 차선 표시(카운티마다 많이 다를 수 있음)와 같은 다양한 공간적 측면에 대해 학습하고 표준 통행 너비를 커버하기 위해 얼마나 멀리 떨어져 있어야 하는지와 같은 다른 규칙을 적용합니다. Stefanchuk는 "우리는 알고리즘이 무엇을 하길 원하는지 개념화하고 시각화해야 했습니다. 교외 지역의 구불구불한 도로, 실제 세계에서 어떻게 운전할지, 앞과 옆 창문으로 무엇을 볼 수 있을지 생각했습니다. 그런 다음, AI가 채널화된 CAD 레인을 따라 '이동'하도록 가르치고 인공지능이 무엇을 볼 수 있는지 배우는 방법을 알려줍니다."라고 말합니다.
Stefanchuk은 "CLIP/로봇 자동차가 실제로 유리한 점이 몇 가지 있습니다. 그중 하나는 모든 데이터를 한 번에 수집할 필요가 없고, 해당 사례에서 보이는 데이터만 수집하여 의사 결정을 내리고 보고할 준비가 될 때까지 데이터를 정리한 다음 계속 고속도로를 따라 이동하면 된다는 점입니다. 포장 도로 표시와 같은 것을 발견하면 몇 가지 시각적 AI 모델들을 사용하여 해당 포장 도로 표시가 무엇을 나타내는지 파악할 수 있습니다."라고 말합니다.
Stefanchuk는 "우리가 CLIP 프로젝트에서 배운 것은 우회전 화살표나 좌회전 화살표와 같은 기호로 시작하여 AI가 이를 감지하도록 가르칠 수 있다는 것입니다. 하지만 이를 통해 유추할 수 있는 정보를 바탕으로 내가 어떤 차선을 주행하고 있는지 등 다른 결정을 내릴 수 있습니다. 우리가 우회전 차선, 통과 차선, 좌회전 차선, 유턴 차선 등에서 운전하고 있나요?"라고 덧붙입니다.
Phocaz는 포장 도로 표시에만 집중하지 않았습니다. 포장 도로 표시에서와 동일한 접근 방식을 사용하여 모든 셀 라이브러리에 있는 모든 셀에 대한 기계 학습 모델을 만들 수 있습니다. "CLIP과 별도의 애플리케이션인 당사 소프트웨어(Phorz AI라고 함)는 회전 화살표, 자전거 도로, 차도, 배수로 등과 같은 하나 이상의 셀(기호)로 시작하여 자신만의 MLM을 만드는 과정을 사용자에게 안내합니다. 그런 다음 사용자가 생성한 MLM을 적용하여 모든 iTwin(디지털 트윈) 모델에서 이러한 개체를 감지할 수 있습니다. 누구나 쉽게 CAD 프로젝트에서 특징을 감지할 수 있는 MLM을 만들 수 있도록 하자는 아이디어였습니다. GDOT의 CLIP의 경우, 우리가 학습시킨 MLM이 있어 이 단계를 수행할 필요가 없습니다."라고 말합니다. 다른 고객의 프로젝트의 경우, 마스터 모델이 생성되지만, 셀과 기호가 도시마다, 그리고 카운티마다 다를 수 있으므로 모든 사용자가 AI를 증강하고 학습할 수 있도록 문을 열어둡니다.
Phocaz는 2023년 10월 11~12일에 싱가포르에서 개최된 연례 Year in Infrastructure Going Digital 어워드의 엔터프라이즈 엔지니어링 카테고리에서 결선 진출자로 선정되는 영예를 안았습니다. 이 행사에서 벤틀리시스템즈의 기술 부사장인 Julian Moutte는 기조 연설에서 CAD 고속도로 도면에서 좌회전 화살표를 추출하는 CLIP을 시연했습니다. Moutte는 "GDOT는 항상 CAD 도면이 풍부한 자산 데이터의 원천이 될 수 있다고 믿었습니다. 하지만 데이터에 액세스하려면 수천 개에 달하는 설계도와 도면을 수작업으로 수집한 다음 각 자산을 육안으로 검사해야 했기 때문에 많은 시간이 소요되었습니다. 다크 데이터에 빛을 비추기 위해 Phocaz는 iTwin 기반의 ProjectWise를 사용하여 특징 감지 및 공간 참조 기능을 갖춘 AI를 사용하여 보다 효율적으로 분석할 수 있는 디지털 트윈을 만들었습니다. Phocaz는 한 걸음 더 나아가 새로운 AI 기술을 사용하여 모델 간의 간극을 메웠습니다. 그들은 중앙선을 감지하여 디지털 트윈에서 차선을 따라 가상으로 주행할 수 있는 AI 에이전트를 만들었습니다. AI 자동화를 통해, 고객은 더 이상 데이터를 추출하는 프로세스에 많은 시간과 비용을 들이지 않아도 됩니다.
향후 애플리케이션
Ramsey는 "CLIP은 교통 고객을 위해 이 문제를 해결할 수 있도록 개발한 고유한 워크플로입니다. 우리는 작업의 전제 조건인 도로라는 맥락에서 시작할 수 있습니다. 따라서, 건축과 같은 분야에 쉽게 적용할 수는 없을 것입니다. 하지만 일단 이러한 맥락이 무엇인지 이해하면 이러한 종류의 설계에서 데이터를 수집하는 방법에 대해 생각할 수 있습니다."라고 말합니다.
이 접근 방식을 인프라에 적용할 수 있는 애플리케이션에는 어떤 것이 있을까요? 유틸리티가 바로 떠오릅니다. 전송 및 분배 네트워크가 있으며, 전화 및 통신 네트워크의 경우에는 선형 특징과 부품 유형을 보다 세밀하게 분석하는 데 도움이 될 수 있는 규칙 기반 연결 요소가 있습니다. 지하 유틸리티의 경우, 모든 특징을 물리적으로 찾는 것이 비현실적이라는 점을 고려하면 CAD 기능 추출의 자동화가 매우 유용할 수 있습니다. 이러한 종류의 솔루션을 사용하면 스캔한 엔지니어링 도면에서 특징을 추출하는 데 어느 정도 성공할 수 있다는 것은 의문의 여지가 없습니다. 그러나 공간 참조 문제(크기 및 위치 등록)와 래스터에서 벡터로의 변환 품질/완성도 문제가 있습니다(AI를 사용하여 이러한 문제도 개선하기 위해 많은 진전이 있었지만 여전히 존재합니다).
지자체, 유틸리티, 캠퍼스에 디지털 트윈을 구축하려고 할 때, 전체 물리적 데이터 캡처 및 준공 조사에 드는 비용이 광범위한 채택의 걸림돌로 작용하고 있습니다. 그러나 일부 특징은 어떠한 설계 도면도 없이 구성되었으며, 최소한 지난 40년 동안 이루어진 것들 중에서는 이와 같은 방식으로 활용할 수 있는 CAD 도면들이 있을 가능성이 높습니다. 수백만 개의 CADS 파일에는 방대한 양의 다크 데이터가 숨어 있습니다. 이제 더 잘 활용할 시간입니다.