Enriquecimento semântico de modelos BIM para a classificação de espaços residenciais utilizando técnicas de machine learning
BIM, enriquecimento semântico, machine learning, classificação multiclasse, ensemble.
O processo BIM surgiu na indústria da AEC com a proposta de se desenvolver um modelo digital de uma edificação para que este pudesse auxiliar nas etapas da concepção do projeto, construção da edificação e gerenciamento e manutenção desta. Estes modelos possuem uma grande quantidade de informações e que, constantemente, precisam ser trocadas entre as diversas disciplinas envolvidas no projeto. Como essas disciplinas utilizam ferramentas diferentes para a leitura das informações do modelo, é importante garantir a troca de informações de forma completa, para se evitar o trabalho de correção e/ou acréscimo de dados. O arquivo não proprietário IFC foi então criado para que houvesse a interoperabilidade entre os diferentes softwares que se baseiam no processo BIM. Entretanto, devido à complexidade dos modelos digitais e à grande variedade de softwares que possam a vir se envolver no projeto, ainda é comum que haja perca de informações. Surgiu-se, então, a necessidade de utilização de metodologias que auxiliassem no processo de interoperabilidade e promoção do enriquecimento semântico de arquivos IFC. Entre essas metodologias, o machine learning vem ganhando espaço, com suas diversas técnicas que utilizam o processo de aprendizagem por treinamento para a predição de novas informações. Este trabalho propõe e valida modelos de machine learning (ML) e estratégias para promover o enriquecimento semântico de modelos BIM para melhorar a interoperabilidade entre projetos de arquitetura e engenharia. Diversas técnicas ML (k-Nearest Neighbor, Bagged Tree, SVM-Gaussiana, SVM-Quadrática e SVMCúbica) foram implementadas na classificação de espaços em modelos residenciais. Além dos tradicionais classificadores binários, foram propostas duas técnicas por votação, multiclassebinário e ensemble, para melhorar a acurácia e diminuir o overfitting durante o processo de classificação. Os resultados demonstram que as técnicas por votação podem ser usadas com sucesso como estratégias de enriquecimento semântico para classificar, de forma precisa, classes de espaços residenciais a partir de variáveis simples e fáceis de se obter de arquivos IFC. As estratégias e técnicas propostas podem melhorar a interoperabilidade de modelos BIM, classificando de forma eficiente espaços residenciais sem a necessidade direta de intervenção humana