AULA 7 - Microprocessadores - Graduação: mudanças entre as edições
imported>Fargoud |
imported>Fargoud |
||
| Linha 147: | Linha 147: | ||
Edição das 12h41min de 24 de abril de 2018
Estrutura e Funcionamento da CPU
Neste capítulo estudaremos características da maioria das CPUs.
Pilhas
Uma pilha , ou stack é uma estrutura de dados ordenada do tipo LIFO (last-in-first-out), na qual apenas um dos elementos pode ser acessado, em um dado instante - o elemento do topo da pilha.
O tamanho da pilha, ou o número de elementos empilhados, é variável. Normalmente, existe um tamanho máximo de "níveis" da pilha, mas estes podem ser continuamente acrescentados ou removidos.
Quase todas as pilhas são controladas por 3 apontadores/ponteiros (variáveis que armazenam endereços de memória):
- o apontador que endereça o topo da pilha, normalmente chamado de TOP - este valor é incrementado ou decrementado, conforme a pilha aumenta ou diminui (até o limite máximo de LENGHT, e o limite mínimo de BOTTOM);
- o apontador que endereça o limite máximo de tamanho da pilha, muitas vezes chamado de LENGHT, e
- o apontador que endereça a base da pilha, também chamado de BOTTOM.
Normalmente, a instrução que empilha, isto é, coloca um novo dado no topo da pilha é a instrução PUSH. Da mesma forma, a instrução que desempilha, ou seja, remove o item do topo da pilha, normalmente, chama-se POP.
Na grande maioria dos casos, as pilhas são usadas nas CPUs para gerenciar a chamada e retorno de procedimento. Ou seja, é comum que se armazene endereço de retorno nas pilhas, ou status de registradores, etc.
Alguns processadores possuem pilhas para uso interno. Porém estas não estão disponíveis para os programadores.
Quando estiverem, instruções específicas para processamento nas pilhas, além de PUSH e POP, são desejáveis.
Por exemplo:
Note que a última instrução, MUPST, de MUltiPlica STack atuará sobre os dois últimos valores do topo da pilha.
Na imensa maioria dos casos, as operações lógico-aritméticas nas pilhas seguem esta notação pós-fixa, também chamada de notação polonesa reversa. Nesta notação, o operador vem depois dos operandos.
Exemplo:
a + b ⇒ a b + a + (b x c) ⇒ a b c x + (a + b )x c ⇒ a b + c x
A figura abaixo ilustra todos os passos, e comportamento da pilha, se esta estivesse executando a sequência de instruções de pilha abaixo, para efetuar a operação f = (a - b)/(c + d x e):
(I) PUSH A (II) PUSH B (III) SUB (IV) PUSH C (V) PUSH D (VI) PUSH E (VII) MUL (VIII) ADD (IX) DIV (X) POP F
Representações Little-Endian, Big-Endian e Bi-Endian
A partir do momento em que os valores utilizados nas CPUs começaram a ultrapassar o limite de um byte (8 bits), surgiu a dúvida: "como dispor estes bytes componentes de cada palavra na memória?"
Byte menos significativos em endereços mais baixos da memória, ou vice-versa.
Por exemplo:
Seja o valor hexadecimal 12345678h, armazenado em 32 bits, a partir da posição de memória 184, em memória endereçável a cada byte.
No mapeamento mostrado à esquerda, em (a), o byte mais significativo é armazenado no menor endereço de byte. Isto é conhecido como representação big-endian e é equivalente à ordem de escrita ocidental.
No mapeamento mostrado à direita, em (b), o byte menos significativo é armazenado no menor endereço de byte. Isto é conhecido como representação little-endian, e é remanescente da ordem de avaliação das operações aritméticas, da direita para a esquerda.
Modos de Endereçamento
Nas aulas anteriores, focamos o que faz um conjunto de instruções. Em particular, examinamos os tipos de operação e de operandos que podem ser especificados em instruções de máquinas.
Esta aula aborda a questão de como especificar operações e operandos nas instruções:
- como o endereço de um operando é especificado e,
- como são organizados os bits de uma instrução, para definir a operação e os endereços de operandos, em uma instrução.
Em um formato de instrução típico, os campos de endereço são relativamente pequenos. Para viabilizar a referência a uma enorme quantidade de posições de memória principal, ou virtual, várias técnicas de endereçamento têm sido empregadas.
As mais comuns são:
- Endereçamento imediato;
- Endereçamento direto;
- Endereçamento indireto;
- Endereçamento de registrador;
- Endereçamento indireto via registrador;
- Endereçamento por deslocamento;
- Endereçamento a pilha
| MODO | Algoritmo | Principal Vantagem | Principal Desvantagem |
|---|---|---|---|
| Imediato | Operando = A | Nenhuma referência à memória | Limitada magnitude do operando |
| Direto | EA = A | Simples | Espaço de endereçamento limitado |
| Indireto | EA = (A) | Espaço de endereçamento grande | Múltiplas referências à memória |
| Registrador | EA = R | Nenhuma referência à memória | Espaço de endereçamento limitado |
| Indireto via Registrador | EA = (R) | Espaço de endereçamento grande | Referência extra à memória |
| Deslocamento | EA = A + (R) | Flexibilidade | Complexibilidade |
| Pilha | EA = *Top | Nenhuma referência à memória | Aplicabilidade limitada |
Onde:
A = conteúdo de campo de endereço da instrução
R = conteúdo de campo de endereço que referencia um registrador
EA = endereço real (efetivo) da posição que contém o operando
(X) = conteúdo da posição de endereço X
Endereçamento imediato
A forma mais simples é o endereçamento imediato, no qual o valor do operando é especificado diretamente na instrução
OPERANDO = A
Esse modo pode ser usado para definir e usar constantes ou para atribuir valores iniciais em variáveis.
O valor é armazenado em complemento-dois, e o bit de sinal é propagado.
A grande desvantagem é que o tamanho do operando é limitado pelo tamanho do campo de endereço, o qual, na maioria dos conjuntos de instrução, é bem menor que o tamanho de uma palavra.
Endereçamento direto
Outra forma simples de endereçamento, na qual o campo de endereço contém o endereço efetivo do operando
EA = A
Também fornece um espaço de endereçamento limitado.
Endereçamento indireto
No endereçamento indireto, o tamanho do campo de endereço normalmente é menor que o tamanho de uma palavra, o que limita a faixa de endereços que podem ser especificados.
Uma possível solução é especificar, no campo de endereço, o endereço de uma palavra de memória, que, por sua vez, contém o endereço do operando:
EA = (A)
Endereçamento de registrador
Endereçamento indireto via registrador
Endereçamento por deslocamento
Endereçamento a pilha
Máquinas CISC x RISC
Paradigma CISC •Complex Instruction Set Computer –Conjunto de instruções inicialmente simples –Avanços tecnológicos permitiram a fabricação de computadores com mais transistores e menor custo –Projetistas optaram por conjuntos de instruções cada vez mais complexos •Intenção: reduzir a distância semântica entre Assembly e linguagens de alto nível
Instruções com elevado grau semântico •Elevado número de modos de endereçamento (ex: endereçamento indireto em memória) •Elevado número de ciclos de clock por instrução → redução da frequência de clock •Menor número de instruções por programa → menor uso de memória de código •Decodificação através de microcódigo → dificulta/impossibilita o uso de pipeline
Paradigma RISC Reduced Instruction Set Computer –Instruções simples que executam rápido –Elevado número de registradores de uso geral –Decodificação de instruções com lógica combinacional (tabela) –Execução utilizando pipeline → um ciclo de clock por instrução
Paradigma RISC •Regularidade de tempo de execução •Regularidade de tamanho de instrução •Redução da área de silício e tempo de projeto •Efeito final: melhor desempenho, apesar do número de instruções por programa ser maior
O que são os processadores ARM? São processadores de 32 bits (alguns 64 bits) de arquitetura RISC. RISC: Reduced Instruction Set Computing, ou set de instruções reduzido (visando maior eficiência sobre a complexidade do núcleo); Têm 16 registradores de 32 bits, sendo de R0-R12 de uso geral, e os dedicados são SP(Stack Pointer), LR (Link Register) e PC (Program counter).
Algumas famílias ARM: Existem hoje aproximadamente 18 famílias, dentre elas as mais utilizadas são: ARM7, ARM7TDMI, ARM9TDMI, ARM11, Cortex-M, Cortex-A, Cortex-R.
Cada família tem uma especialização. Exemplo: O Cortex-A tem foco na área de processadores para computadores e Smartfones poderosos, o ARM7 abrange uma grande faixa, desde alguns microcontroladores até processadores de videogames portáteis. O foco deste tutorial será na família Cortex-M (em especial os Cortex-M0+) que são arquiteturas focadas para microcontroladores.
Arquiteturas de Von Neumann x Harvard
Família Cortex-M: São Von Neumann (Não existe separação entre barramentos de dados e o barramento da memória de programa):
Cortex-M0 -->Microcontroladores mais simples, suportam somente o set de instruções Thumb com algumas instruções do Thumb2 (sempre executam no modo Thumb); Cortex-M0+ -->Apresentam algumas melhorias em relação ao M0, além de ter suporte opcional à proteção de memória (MPU); Cortex-M1 -->São utilizados juntos com FPGAs;
São Harvard (Possuem barramentos separados para dados e instruções):
Cortex-M3 -->São microcontroladores mais poderosos, suportam completamente os sets Thumb e Thumb2, além de multiplicação têm divisão por hardware; Coxtex-M4 -->Têm instruções para processamento de sinais (DSP), têm uma unidade de ponto flutuante opcional (Cortex-M4F).
Pipelines
Pipeline (3 Estágios) 1. Busca (Fetch) – Busca da instrução na memória 2. Decodificação (Decode) – Decodificação dos registradores usados na instrução 3. Execução (Execute) – Leitura de registradores – Operações lógicas, aritméticas e de deslocamento; – Escrita em registradores
Pipeline: Situação Ideal
• Todas as operações realizadas em registradores → 6 instruções em 6 ciclos de clock (ARM Cortex-M3)
Pior caso: salto indireto (instrução BX), 3 ciclos de clock para completar o salto (ARM Cortex-M3)
Arquitetura = documento de especificação – Instruções – Exceções – Registradores – Memória • Ex: ARMv4, ARMv7, etc. • Não tem custo, pode ser obtido diretamente do website da ARM
Organização = implementação física (silício) – Ex: ARM7TDMI, ARM Cortex-M3, etc. • ARM vende a implementação de núcleos em VHDL ou máscara de difusão para empresas licenciadas
18 registradores de 32 bits • Tratamento muito eficiente de interrupções • Gerenciamento de consumo de energia • Projetado para ser programado em C (completamente, até mesmo tratamento de reset, interrupções e exceções) • Permite uso de sistemas operacionais (RTOS) – Modelo Usuário/Supervisor
Arquitetura ARMv7M • Sem memória cache ou Unidade de Gerenciamento de Memória (MMU) • Tabela de vetores contém endereços, não instruções • Instrução DIV • Interrupções salvam e recuperam automaticamente o estado do processador
Controlador de Interrupções é parte da macrocélula Cortex-M3 • Mapa de memória fixo • Registrador único de estado do processador • Núcleo de processamento Thumb-2 – Mistura de instruções de 16 e 32 bits (alta densidade de código), mas não requer alinhamento para instruções de 32 bits
| << Página da disciplina | < Conjunto de Instruções | Aula 7 - Estrutura e Funcionamento da CPU | Arquitetura ARM > |
|---|













