Za smanjenje vremena pristupa podacima i instrukcijama u operativnoj memoriji procesoru se
dodaje keš-memorija (ultrabrza memorija) čija brzina odgovara brzini rada procesora. Keš-memorija je mala, ultrabrza poluprovodnička memorija sa neposrednim pristupom. U keš-memoriju se čuvaju podaci i instrukcije iz operativne memorije koje procesor trenutno koristi. Keš-memorija služi za usaglašavanje brzine procesora i operativne memorije koja je sporija od procesora za red veličine (oko 10 puta). Ona omogućava povećanje brzine obrade, jer se u njoj nalaze tekući podaci i tekuće instrukcije programa kojima procesor pristupa znatno brže, čime se povećava produktivnost rada procesora, odnosno vreme izvršenja programa. Cilj efikasnog memorijskog sistema je da efektivno vreme pristupa procesora podacima bude vrlo blisko vremenu pristupa keš-memoriji. Keš-memorija se koristi na sledeći način. Operativna i keš-memorija su podeljene na jedinice koje se nazivaju blokovi. Blok (ponekad se naziva i linija) predstavlja skup od n sukcesivnih memorijskih lokacija koji se uvek kao celina prenosi između operativne i keš-memorije. To znači da se svi podaci ili instrukcije u nekom bloku istovremeno nalaze ili ne nalaze u keš-memoriji. Jedinica prenosa između centralnog procesora i keš-memorije je fizička reč. Jedinica prenosa između keš-memorije i operativne memorije je blok. Veličina bloka obično iznosi između 4 i 128 bajtova. Kapacitet keš-memorije je u opsegu od 1 do 256 kB. Broj blokova operativne memorije znatno je veći od broja blokova keš-memorije, tako da se u keš-memoriji u istom trenutku nalaze kopije samo malog broja blokova operativne memorije. Kada centralni procesor generiše adresu memorijske lokacije, formira se upravljački signal za pristup keš-memoriji. Ukoliko se podatak sa traženom adresom nalazi u keš-memoriji, on se prenosi u procesor radi obrade ili se zamenjuje novom vrednošću iz procesora koja predstavlja rezultat obrade. Ukoliko u keš-memoriji nema blokova sa traženom adresom, aktivira se procedura kojom se iz keš- memorije jedan blok šalje u operativnu memoriju, a na njegovo mesto se iz operativne memorije poziva traženi blok koji se prenosi u keš-memoriju, a istovremeno se traženi podatak prenosi u operativnu memoriju.