개인화 연합학습 프레임워크로 프라이버시 보호
대리 타깃 기법으로 라벨 공유 문제 해결
암호화 손실값 전송으로 통신량 50% 절감

좌측부터 권민혜 교수, 김미르(박사과정), 박희원(석사과정) 연구원. 사진=숭실대
좌측부터 권민혜 교수, 김미르(박사과정), 박희원(석사과정) 연구원. 사진=숭실대

[포인트데일리 성창훈 기자] 숭실대학교는 전자정보공학부 권민혜 교수 연구팀(박사과정 김미르, 박희원)이 개발한 '개인정보 보호형 연합학습 기술'에 관한 논문이 국제전기전자공학회(IEEE) 발행 학술지 'IEEE Internet of Things Journal'에 실렸다고 최근 밝혔다. 논문 제목은 'Personalized Split Federated Learning with Early-exit: Pre-training and Online Learning Against Label Shifts'다. 

연구팀이 개발한 기술은 원본 데이터를 외부로 전송하지 않으면서도 각 사물인터넷(IoT) 기기가 독자적으로 학습하고 환경 변화에 대응할 수 있는 인공지능 시스템이다.

연구의 핵심은 개별 IoT 기기들이 원시 데이터를 직접 공유하지 않고도 협업 학습이 가능한 개인화 연합학습 프레임워크를 구축한 것이다. 이를 통해 개인정보 노출 위험을 차단하면서 학습 성능과 정확성을 함께 끌어올렸다.

종래의 AI 시스템은 학습 과정에서 데이터를 중앙서버로 집중시켜야 했다. 하지만 이 방법은 프라이버시 침해 우려와 통신 비용 부담, 기기 사양 제한 등의 문제점이 있었다.

연구팀은 이 같은 한계를 극복하고자 각 IoT 기기가 자신의 데이터로 모델 일부를 독립 학습한 뒤, 암호화된 손실값만 서버로 보내는 방식을 개발했다. 덕분에 원본 데이터는 한 차례도 외부로 나가지 않으면서 서버와 여러 기기가 함께 고성능 AI를 학습할 수 있게 됐다.

특히 이번 연구는 서버가 정답 데이터를 직접 받지 않고도 학습할 수 있는 '대리 타깃' 생성 기법을 적용했다는 점에서 주목받고 있다. 이 기법은 기존 연합학습의 약점이었던 라벨 공유로 인한 개인정보 침해 가능성을 원천 차단했다.

그 결과 학습 효율은 그대로 유지하면서 데이터 보안 수준은 높아졌고, 통신량은 기존 대비 50% 이상 줄어든 것으로 확인됐다.

키워드

#숭실대학교
저작권자 © 포인트데일리 무단전재 및 재배포 금지