칩렛 이종 집적: 핵심 원리 및 보안 도전 과제

academic
chipletee

핵심 원리

칩렛 이종 집적은 단일 대형 SoC(System-on-Chip)를 제조하는 대신, 다양한 기능을 수행하는 여러 개의 작은 다이(칩렛)를 물리적으로 통합하여 하나의 패키지로 만드는 접근 방식입니다. 이는 트랜지스터 스케일링의 물리적 한계에 도달하고, 단일 다이의 설계 복잡도 및 제조 비용이 기하급수적으로 증가함에 따라 주목받고 있습니다. 핵심 원리는 이종 공정 노드에서 생산된 최적화된 칩렛들을 활용하여 성능, 전력 효율성, 면적(PPA)을 개선하고, 유연한 설계 및 생산 비용 절감을 가능하게 하는 데 있습니다.

주요 집적 방식 중 하나는 인터포저 기반 집적입니다. 이 방식에서 칩렛들은 실리콘 인터포저 위에 나란히 배치되며, 인터포저는 칩렛 간의 고밀도 상호연결을 제공합니다. 칩렛과 인터포저 사이의 전기적 연결은 주로 마이크로 범프(micro-bump)를 통해 이루어집니다. 이 범프 피치(PbumpP_{bump})는 신호 무결성 및 전력 분배 네트워크(PDN) 성능에 critical한 영향을 미칩니다. 일반적으로 인터포저 기반 집적은 전통적인 PCB(Printed Circuit Board) 기반 패키징(PPCB100 μmP_{PCB} \approx 100~\mu m)보다 훨씬 미세한 피치(Pinterposer10 μmP_{interposer} \approx 10~\mu m)를 제공하여, 더 높은 대역폭과 낮은 지연 시간을 달성합니다.

칩렛 간의 데이터 전송 대역폭($B$)은 상호연결의 총 개수(NinterconnectN_{interconnect}), 각 연결의 데이터 전송률(RdataR_{data}), 그리고 채널 효율(η\eta)에 의해 결정됩니다. 즉, B=Ninterconnect×Rdata×ηB = N_{interconnect} \times R_{data} \times \eta 입니다. 인터포저 기술은 NinterconnectN_{interconnect}를 크게 증가시킬 수 있으며, 짧은 경로와 균일한 전송 특성으로 RdataR_{data}η\eta를 최적화합니다. 예를 들어, 10Gbps의 데이터 전송률을 가진 1000개의 인터커넥트는 이론적으로 10Tbps의 대역폭을 제공할 수 있습니다.

열 관리 또한 중요합니다. 칩렛에서 발생하는 열($Q$)은 패키지 전체의 온도($T$) 상승을 유발합니다. 칩렛 간 열 전달은 열 저항(RthR_{th}) 네트워크를 통해 모델링될 수 있습니다. 칩렛 $i$에서 발생하는 열이 주변 환경으로 방출될 때의 온도 상승(DeltaTiDelta T_i)은 칩렛의 전력 소모(Ppower,iP_{power,i})와 총 열 저항(Rtotal,iR_{total,i})에 비례합니다: DeltaTi=Ppower,iimesRtotal,iDelta T_i = P_{power,i} imes R_{total,i}. 칩렛 이종 집적에서는 여러 칩렛이 밀집되어 있어 국부적인 핫스팟이 발생하기 쉬우므로, 열 전도도가 높은 재료($k > 100~W/(mK)$)와 효율적인 방열 솔루션이 필수적입니다.

직관적 비유: 칩렛 이종 집적은 레고 블록으로 건물을 짓는 것에 비유할 수 있습니다. 각 칩렛은 특정 기능을 가진 레고 블록(CPU, GPU, 메모리 등)이며, 인터포저는 이 블록들을 조립하는 데 사용되는 견고한 '바닥판'입니다. 이 바닥판 덕분에 각 블록은 정밀하게 연결되어 빠르고 효율적으로 정보를 주고받으며, 전체 시스템은 더 크고 복잡한 기능을 수행하는 하나의 '건물'이 됩니다. 다양한 기능의 블록을 필요에 따라 선택적으로 조합하여, 매번 완전히 새로운 건물을 설계하는 것보다 훨씬 빠르고 유연하게 다양한 건물을 만들 수 있는 것입니다.

논문 심층 리뷰

Security Assessment of Interposer-based Chiplet Integration — Shayan et al. (2020) (arXiv)

핵심 원리: 이 논문은 인터포저 기반 칩렛 이종 집적의 새로운 보안 취약점을 다루고, '블랙박스' 설계 단계에 대한 접근 없이 하드웨어 트로이 목마(Hardware Trojans), 역공학, 지적 재산(IP) 도용을 탐지하고 저지하는 방안을 제안합니다. 전통적인 SoC 설계에서는 내부 설계 단계에서 보안 조치가 이루어지지만, 칩렛 통합은 이미 검증된 IP 블록(칩렛)을 재사용하여 설계 시간과 비용을 줄이므로, 이 IP 블록들의 내부 설계에 대한 완전한 접근이 어렵거나 불가능한 경우가 많습니다. 이러한 '블랙박스' 칩렛의 보안 문제를 해결하기 위해, 논문은 기능적으로 다양한(functionally diverse) 칩렛과 내재된 논리적 중복성(inherent logic redundancy)을 활용하는 메커니즘을 제안합니다.

기능적으로 다양한 칩렛을 사용하는 원리는 다음과 같습니다. 동일한 기능을 수행하도록 설계되었지만 내부 구현 방식이 다른 두 개 이상의 칩렛을 병렬로 배치합니다. 이 칩렛들에 동일한 입력이 주어졌을 때, 만약 그 중 하나에 하드웨어 트로이 목마가 삽입되어 있다면, 트로이 목마가 활성화될 경우 해당 칩렛의 출력이 다른 칩렛들의 출력과 불일치하게 됩니다. 이 불일치를 비교기(comparator)를 통해 감지하여 트로이 목마의 존재를 알리거나 시스템을 비활성화하는 방식으로 작동합니다. 이는 마치 두 명의 독립적인 전문가에게 같은 문제를 풀게 한 뒤 답이 다르면 문제가 있음을 아는 것과 유사합니다.

Loading diagram...

내재된 논리적 중복성은 IP 도용 방지 측면에서 활용됩니다. 블랙박스 칩렛 내부에 존재하는 불필요하거나 비활성화된 논리 회로를 의도적으로 남겨두거나 삽입함으로써, 역공학을 통해 칩렛의 기능을 완전히 이해하고 복제하는 것을 어렵게 만듭니다. 이는 미로 속에 함정을 심어두어 길을 찾기 어렵게 만드는 것과 비슷합니다.

연구 방법: 저자들은 MIPS 프로세서, DCT(Discrete Cosine Transform) 코어, AES(Advanced Encryption Standard) 코어를 Xilinx CORE GENERATOR IP 카탈로그의 다양한 IP를 사용하여 인터포저 기반 Xilinx FPGA에 구현했습니다. 이를 통해 제안된 기능적 다양성 및 논리적 중복성 기법이 보안, 설계 시간, 비용 측면에서 어떤 이점을 제공하는지 평가했습니다. 이들의 핵심 알고리즘은 기능적 등가성을 유지하면서 내부 구현을 다르게 하는 '다양한 구현 생성' 전략과, 트로이 목마 탐지를 위한 '실시간 출력 비교' 메커니즘을 포함합니다.

정량적 결과: 이 논문의 추상에서는 구체적인 수치적 결과(예: X% 보안 개선, Y% 비용 절감)가 명시적으로 제공되지 않습니다. 다만, 제안된 접근 방식이 인터포저 기반 통합 환경에서 보안 강화, 설계 시간 단축, 비용 절감 효과를 검증했다고 언급하고 있습니다. 세부적인 측정항목과 결과는 논문 본문에 상세히 제시될 것으로 예상됩니다.

측정항목 결과 기존 대비
하드웨어 트로이 목마 탐지율 N/A (검증됨) N/A
역공학 저지 효과 N/A (향상됨) N/A
IP 도용 방지 효과 N/A (강화됨) N/A
설계-시장 출시 시간 N/A (단축됨) N/A
설계 비용 N/A (절감됨) N/A

의의: 이 연구는 블랙박스 칩렛 사용으로 인한 보안 위협에 대응하기 위한 실용적인 프레임워크를 제시합니다. 특히, 칩렛의 내부 설계에 대한 접근 없이도 보안을 강화할 수 있는 메커니즘을 제공하여, 칩렛 이종 집적 기술의 광범위한 채택에 필수적인 보안 신뢰성을 높이는 데 기여합니다.

미해결 과제

1. 칩렛 인터페이스 표준화 및 상호 운용성: 현재 다양한 칩 공급업체마다 고유한 칩렛 인터페이스 기술을 개발하고 있어, 칩렛 간의 원활한 상호 운용성이 부족합니다. 예를 들어, 칩렛 간의 고속 통신을 위한 물리적 계층(PHY) 및 프로토콜 표준(예: BoW, UCIe)이 있지만, 아직 보편적으로 채택된 단일 표준은 없습니다. 이로 인해 공급업체 종속성 문제가 발생하며, 칩렛 생태계의 성장을 저해합니다. 필요한 것은 다양한 벤더의 칩렛이 '플러그 앤 플레이' 방식으로 통합될 수 있는 개방적이고 강력한 표준입니다. 이를 위해서는 전기적 특성, 열 관리, 전력 전달, 그리고 신호 무결성에 대한 엄격한 명세가 필요하며, 현재는 각 표준 기관의 컨소시엄을 통한 합의 도출이 가장 유망한 접근 방식으로 시도되고 있습니다.

2. 칩렛 수준의 열 관리 및 전력 무결성 최적화: 여러 칩렛이 고밀도로 집적될 때 발생하는 국부적인 열점(hotspot)과 전력 공급 네트워크(PDN)의 노이즈는 칩렛의 성능과 신뢰성을 저해하는 주요 요인입니다. 각 칩렛은 서로 다른 전력 소모 특성과 발열 패턴을 가지므로, 통합된 패키지 내에서 전체적인 열 저항(RtotalR_{total})을 낮추고 전력 변동($Delta V$)을 최소화하는 것이 어렵습니다. 특히, 인터포저를 통한 열 확산은 제한적일 수 있으며, 전력 공급 레일의 임피던스(ZPDNZ_{PDN})가 특정 주파수에서 높아지면 전압 강하가 심화됩니다. 필요한 것은 칩렛 레벨에서 전력 및 열 모델링을 결합한 통합 시뮬레이션 환경과, 이를 기반으로 한 동적 전력 및 열 관리 기법입니다. 액체 냉각, 미세 채널(microfluidic channel), 또는 열 전도성 인터페이스 물질(TIM)의 개선 등 새로운 재료 및 패키징 기술이 연구되고 있습니다.

3. 이종 칩렛 통합의 테스트 및 검증 복잡성: 칩렛 이종 집적 시스템은 단일 SoC에 비해 테스트 및 검증이 훨씬 복잡합니다. 각 칩렛은 자체적으로 테스트되어야 할 뿐만 아니라, 칩렛 간의 인터페이스 및 전체 시스템으로서의 기능적 상호작용도 검증해야 합니다. 특히, 블랙박스 칩렛의 경우 내부 설계에 대한 접근이 제한적이므로, 전통적인 DFT(Design-for-Test) 기법을 적용하기 어렵습니다 (Shayan et al., 2020, arXiv). 필요한 것은 칩렛 간의 경계를 넘어선 포괄적인 테스트 아키텍처와 새로운 진단 기법입니다. 칩렛 레벨에서 표준화된 테스트 인터페이스(예: IEEE 1838)를 도입하고, 시스템 레벨에서 고장 격리(fault isolation) 능력을 향상시키는 것이 중요합니다. 인공지능 기반의 고장 예측 및 진단 알고리즘 또한 유망한 접근 방식으로 탐색되고 있습니다.

참고 문헌

  1. [1] Security Assessment of Interposer-based Chiplet Integrationhttp://arxiv.org/abs/2010.13155v1

댓글

로그인하고 댓글을 작성하세요

불러오는 중...