본문 바로가기
CS이론/컴퓨터구조

캐시 메모리

by limew 2023. 12. 7.

 

  • 속도가 빠른 장치와 느린 장치의 속도차이(병목현상)를 해결하는 메모리이다.
  • CPU가 빠른 속도로 데이터를 주고 받을 수 있도록 캐시메모리는 CPU와 인접하게 위치한다.
  • 참조지역성의 원리에 따라 주기억장치나 보조기억장치에서 자주 사용하는 해당 데이터 뿐만 아니라 옆 주소의 데이터를 미리 가져와 임시보관한다.
  • 속도를 향상시키지만, 용량이 적고 비싸다.

 

참조 지역성의 원리

자주 사용되는 데이터에 대한 판단 기준이다.

시간 지역성

for나 while 같은 반복문에 사용하는 조건 변수처럼 한번 참조된 데이터는 잠시후 또 참조될 가능성이 높음

공간 지역성

A[0], A[1]과 같은 연속 접근 시, 참조된 데이터 근처에 있는 데이터가 잠시후 또 사용될 가능성이 높음

 

 

 

CPU안의 캐시메모리

CPU에는 캐시 메모리가 2~3개 정도 사용된다. (L1, L2, L3 캐시 메모리라고 부른다)

 

속도와 크기에 따라 분류한 것으로, 일반적으로 L1 캐시부터 먼저 사용된다. (CPU에서 가장 빠르게 접근하고, 여기서 데이터를 찾지 못하면 L2로 감)

 

듀얼 코어 프로세서의 캐시 메모리 : 각 코어마다 독립된 L1 캐시 메모리를 가지고, 두 코어가 공유하는 L2 캐시 메모리가 내장됨

만약 L1 캐시가 128kb면, 64/64로 나누어 64kb에 명령어를 처리하기 직전의 명령어를 임시 저장하고, 나머지 64kb에는 실행 후 명령어를 임시저장한다. (명령어 세트로 구성, I-Cache - D-Cache)

  • L1 : CPU 내부에 존재
  • L2 : CPU와 RAM 사이에 존재
  • L3 : 보통 메인보드에 존재한다고 함

캐시 메모리 크기가 작은 이유는, SRAM 가격이 매우 비쌈

 

 

SRAM이란

더보기

SRAM은 "Static Random Access Memory"의 약자로, 컴퓨터 메모리의 한 유형이다. SRAM은 주로 캐시 메모리레지스터와 같은 곳에서 사용되며, 주로 빠른 액세스 속도와 내구성을 위해 설계된다

SRAM의 주요 특징

  1. 액세스 속도가 빠름: CPU 캐시와 같이 빠른 속도로 데이터를 저장하고 검색하는 데 사용된다.
  2. 액세스 지연이 없음: SRAM은 주로 비트를 저장할 때 레지스터와 같은 회로로 구성되어 있어, 데이터에 직접 액세스할 수 있어 지연이 거의 없다.
  3. 비교적 높은 에너지 소비: SRAM은 동적 RAM(DRAM)에 비해 높은 에너지를 소비하며, 면적당 저장 용량이 작다.
  4. 내구성이 좋음: SRAM은 데이터를 유지하기 위해 주기적으로 새로 고쳐야 하는 DRAM과는 다르게, 전원이 꺼져도 데이터를 유지할 수 있다.

SRAM은 레지스터와 CPU 캐시 메모리 등의 중요한 부분에서 사용되며, 빠른 속도와 안정성이 필요한 곳에서 주로 활용된다. 하지만, DRAM보다 비용이 높고 용량이 작기 때문에 대량의 데이터를 저장하는 데에는 많이 사용되지 않는다.

 

 

 

CPU가 요청한 데이터가 캐시에 있으면 'Cache Hit', 없어서 DRAM에서 가져오면 'Cache Miss'라고 한다.

캐시 미스 경우 3가지

1. Cold miss

해당 메모리 주소를 처음 불러서 나는 미스

2. Conflict miss (주소 할당 문제)

캐시 메모리에 A와 B 데이터를 저장해야 하는데, A와 B가 같은 캐시 메모리 주소에 할당되어 있어서 나는 미스 (direct mapped cache에서 많이 발생)

3. Capacity miss (공간 문제)

캐시 메모리의 공간이 부족해서 나는 미스 

 

캐시 크기를 키워서 문제를 해결하려하면, 캐시 접근속도가 느려지고 파워를 많이 먹는 단점이 생김

 

 

 

캐시 구조 

Direct Mapped Cache
블록이 캐시의 딱 한 장소에만 들어갈 수 있는 구조

 

메모리 공간이 32개(00000~11111)이고, 캐시 메모리 공간은 8개(000~111)인 상황

 

  • DRAM의 여러 주소가 캐시 메모리의 한 주소에 대응되는 다대일 방식
  • 캐시메모리는 인덱스 필드 + 태그 필드 + 데이터 필드로 구성된다. 
  • 데이터를 쓰고 검색하는데 간단하고 빠른 장점이 있지만, Conflict Miss가 발생하는 것이 단점이다. 위 그림처럼 같은 색깔의 데이터를 동시에 사용해야 할 때 발생한다.

 

Fully Associative Cache
블록이 캐시의 어느곳에나 들어갈 수 있는 캐시구조

 

  • 메모리 블록을 캐시의 어떤 엔트리와도 매핑이 가능하기 때문에 Fully Associative 이라고 한다
  • 저장할 때는 매우 간단하지만, 검색이 느리다 (어느 곳에나 있을 수 있기 때문에 캐시 내 모든 엔트리를 다 찾아봐야함)
  • CAM이라는 특수한 메모리 구조를 사용해야하지만 가격이 매우 비싸다.

 

Set Associative Cache
Direct + Fully 의 중간으로, 특정 행을 지정하고 그 행안의 어떤 열이든 비어있을 때 저장하는 구조

 

  • Direct에 비해 검색 속도는 느리지만, 저장이 빠르고 Fully에 비해 저장이 느린 대신 검색이 빠른 중간형이다.

 

 

 

참고

'CS이론 > 컴퓨터구조' 카테고리의 다른 글

중앙처리장치(CPU) 작동 원리  (0) 2023.12.06
컴퓨터의 구성  (0) 2023.12.06