(Charge Coupled Device) inventado nos anos 70 por Boyle e Smith, é o chip sensor responsável por registrar a imagem 'vista' por uma câmera de vídeo. As lentes da câmera projetam sobre o mesmo a imagem, que é convertida em impulsos elétricos gerando assim o sinal de vídeo. Exemplo de um CCD:

Em seus primórdios o CCD foi desenvolvido como um chip de memória, não um chip de imagem, assim como também ocorreu com o CMOS. A descoberta no entanto de tecnologias melhores para armazenamento de dados, como o EEPROM (Electrically Erasable Programmable Read Only Memory) fez com que esses chips se tornassem obsoletos para essa função. Por outro lado, a grande facilidade de transferência de cargas elétricas dos mesmos (tanto o CCD como o CMOS) sugeriu seu uso para registro de imagens formadas em uma grade de pixels. Conectados a esta grade de pixels, os chips poderiam descarregar individualmente e com grande rapidez as cargas acumuladas em cada um deles, ou seja, efetuar a "leitura" indireta da imagem ali projetada pelas lentes de uma câmera. Nessa função o CCD se saiu melhor, produzindo imagens com qualidade muito maior do que o CMOS, fazendo com que passasse a ser empregado em câmeras de vídeo no lugar dos antigos tubos de imagem. O primeiro CCD para registro de imagens foi comercializado em 1973.

O CCD é composto por milhares de pontos sensíveis à luz. Cada um destes pontos é uma miniatura de foto-célula utilizada por calculadoras que funcionam com luz solar. Nestas calculadoras, a eletricidade é gerada pelas foto-células, que convertem luz em energia (um efeito descoberto por Albert Einstein e que lhe valeu o prêmio Nobel de 1905). Quanto mais luz incide sobre as mesmas, mais energia é gerada: a intensidade de corrente criada é proporcional à intensidade da luz.

Uma imagem fotográfica é formada por distintas áreas, claras e escuras: ao ser projetada sobre o CCD, fará com que alguns pontos recebam mais luz, outros menos, outros quase nenhuma, de acordo com o desenho da imagem. Se, em dado instante, cada ponto do CCD (cada micro foto-célula) tiver a intensidade de corrente que está gerando medida e anotada, se existir um dispositivo que recebendo determinada intensidade de corrente brilhe de acordo com esta intensidade, será possível reproduzir a imagem em um aparelho contendo milhares destes dispositivos, dispostos da mesma maneira que as foto-células no CCD.

Este dispositivo é a tela de um aparelho de TV e o processo de anotar (armazenar) e posteriormente reproduzir as intensidades de corrente é o processo de gravação e reprodução em uma fita de vídeo.

Porém em vídeo, como as imagens estão em movimento, não basta registrar estas intensidades de corrente em determinado instante e sim a todo (ou quase todo) instante. Para tanto, um circuito eletrônico 'varre' periodicamente o CCD, percorrendo-o e 'anotando' em cada ponto do mesmo (micro foto-célula) qual a intensidade da corrente naquele momento. O termo Coupled tem a ver com a forma como é feita essa leitura. O CCD é lido (leitura do CCD) em linhas horizontais, da esquerda para a direita e de cima para baixo. À medida que esta varredura é feita, uma sequência de valores de intensidade de corrente é produzida pelo circuito leitor do CCD; para registrar esta sequência, uma fita magnética passa em velocidade constante sobre um dispositivo de gravação (cabeça de vídeo). Um processo eletrônico transforma variações de intensidade de corrente em variações equivalentes de campo magnético, magnetizando a fita. Desta forma a imagem projetada no CCD é registrada na fita.

O processo inverso irá reproduzir a imagem registrada na fita: ao ser a mesma movimentada na mesma velocidade sobre um dispositivo leitor de gravação (cabeça de vídeo) as variações de intensidade de campo magnético serão convertidas pelo circuito eletrônico em variações de intensidade de corrente. Um canhão de elétrons percorrerá, também em linhas horizontais da esquerda para a direita e de cima para baixo, uma trajetória emitindo mais ou menos elétrons (conforme a intensidade da corrente 'lida' na fita) em direção a parte interna do tubo de imagem da TV que, revestido de uma substância capaz de emitir mais ou menos luz conforme receba mais ou menos elétrons, formará na tela a mesma imagem registrada pelo CCD.

Cada um dos pontos sensíveis à luz assemelha-se a uma pastilha em um mosaico de pastilhas de mesmo tamanho alinhadas simetricamente lado a lado e recebe o nome de pixel. Como cada pixel ocupa uma determinada área da imagem, para a qual é medida uniformemente a intensidade luminosa, quanto mais pixels no CCD maior o detalhamento da imagem registrada.

O CCD pode ser lido de duas formas diferentes (rolling shutter x global shutter). Na forma usual, é lido pelo circuito eletrônico linha a linha e o resultado é um sinal analógico, uma sequência de valores de intensidades dos sucessivos pixels dispostos ao longo das linhas. A partir deste ponto, o sinal pode ser gravado diretamente na fita (câmeras analógicas) ou então digitalizado e a seguir gravado em fita / disco (câmeras digitais). Neste caso, a conversão analógico/digital é efetuada por um circuito denominado A-D converter (Analogue to Digital Converter).

O processo de digitalização de um sinal analógico consiste em obter sucessivas amostras das intensidades deste sinal convertendo a seguir estes valores para o formato binário, em um processo denominado sampling. O formato DV por exemplo estabelece cerca de 500 linhas de resolução horizontal: para produzir este valor, é necessário ler 30 vezes por segundo (padrão NTSC) um CCD com cerca de 500 pixels por linha. Aumentando-se a quantidade de pixels no CCD, por exemplo para 800 por linha, há melhora no detalhamento, pois o original a ser digitalizado ganha detalhes mais finos devido ao aumento de 'pastilhas por linha no mosaico'. A quantidade de amostras obtidas durante o processo de sampling é a mesma (13 Mhz para o sistema DV, é uma constante para cada formato), porém as amostras são feitas em cima de um original mais preciso fornecido pelo CCD, algo como, a grosso modo, comparar um mosaico tipo claro / escuro desenhado com azulejos com outro desenhado com pastilhas. Resultado: como a quantidade de amostras não mudou (é fixa por formato, conforme visto acima) , a resolução horizontal continua 500 linhas, porém a imagem obtida com este CCD com mais pixels é melhor. Porém existe um limite para este aumento: é a própria taxa de sampleamento do formato: não adianta aumentar a quantidade de pixels no CCD além dos 500 por linha (o máximo que este formato consegue fragmentar por linha de imagem lida). É por este motivo que a imagem de vídeo não utiliza os pixels do CCD acima de uma determinada quantidade, e o excedente (geralmente muito mais pixels do que o necessário) quando existente, é utilizado por exemplo no modo foto, em câmeras que exercem duplo papel (foto / vídeo), pois a fotografia digital não possui restrição quanto a resolução. Outra aplicação do excedente de pixels é no estabilizador eletrônico de imagem EIS.

A foto-célula presente na calculadora não consegue distinguir cores, apenas reage à luminosidade como um todo, maior ou menor. Por isto diz-se que o CCD não 'enxerga' cores, e sim preto e branco (apenas variações dessa luminosidade). Dentro da faixa de espectro visível da luz, os CCDs tendem a 'enxergar' um pouco mais para o infravermelho do que para o violeta, daí as aplicações como nightshot por exemplo).

Diversos artifícios foram testados ao longo do tempo para conseguir o registro de imagens em cores através do CCD. O mais simples (e barato) consiste em recobrir o CCD com uma máscara (Colour-Filter Array) de micro janelas (filtros) coloridas, nas cores básicas do sistema RGB (vermelho, verde, azul), alternando-se as cores através da superfície do CCD. Um dos arranjos mais utilizados neste processo foi proposto por um pesquisador da Kodak chamado Bryce Bayer, e ficou conhecido como padrão Bayer, mostrado na figura abaixo:

As janelas coloridas são na verdade pequenas lentes microscópicas que captam, concentram e direcionam a luz que incide sobre elas para os pixels do CCD situado logo abaixo, como mostra este desenho em perfil de um CCD do tipo Bayer:

A máscara possui as microlentes arranjadas na sequência vermelho / verde / vermelho / verde ... em uma linha, azul / verde / azul / verde na linha seguinte e assim por diante, repetindo-se esta alternância. A quantidade de janelas verdes é de 50% do total, enquanto que a de vermelhas e azuis é de 25% cada. Bayer percebeu que o olho humano é duas vezes mais sensível ao verde do que ao vermelho e azul.

O circuito eletrônico analisa a intensidade de luminosidade lida nos pixels do CCD colocado logo abaixo das microlentes e faz a combinação das janelas para determinar a cor existente no local, como exemplificado na figura abaixo. Assim por exemplo, se um trecho de 4 pixels (2x2) da imagem é totalmente amarelo (a), os pixels abaixo das janelas de filtros receberão luz conforme (b), ou seja, como amarelo = vermelho + verde, o pixel abaixo do filtro azul ficará apagado (desativado). O circuito eletrônico da câmera concluirá então que a cor de cada pixel é amarela, gerando essa informação de cor para esses 4 pixels (c), em um processo chamado interpolação :

Embora no exemplo mencionado este processo tenha funcionado corretamente, problemas começam a ocorrer em trechos da imagem que exigiriam maior precisão na reprodução das cores, como mostra o desenho a seguir. Ao invés de totalmente amarelo, o trecho da imagem em questão apresenta a fileira vertical da esquerda na cor amarela e a da direita na cor azul, como mostra (d). Os pixels abaixo das janelas receberão luz conforme (e), ou seja, o pixel inferior da direita ficará incorretamente desativado. E o circuito gerará para o mesmo a informação de cor amarela ao invés de azul (f):

O problema aqui é a imprecisão na reprodução das cores e não o fato dos 4 pixels terem que ser combinados para determinar a cor da área em questão. Essa resolução menor do componente cor é normal, uma vez que também o olho humano percebe as cores em resolução bem menor do que percebe os tons claro-escuros. Por outro lado, não ocorre perda de resolução vertical pelo motivo de duas fileiras horizontais de pixels estarem sendo lidas para formar uma única linha na saída, porque este é o processo normal de leitura do CCD (dual-row readout). No entanto, o processo de interpolação cria imagens onde falta nitidez na coloração - a mesma é sempre suavizada .

Outro problema comum do uso de Colour-Filter arrays, como o padrão Bayer visto acima, é o fenônemo chamado color aliasing, que acarreta imprecisão na reprodução das cores de contornos contrastados.

O circuito eletrônico então fará a leitura separada dos pixels, conforme a cor, gerando três sinais diferentes. Estes sinais então podem ser gravados através de métodos que os registram de maneira independente na fita (componentes, sinal ), combinam os 3 separando um sinal de luminosidade (Y/C, sinal) ou combinam os 3 e mais a informação de luminosidade (composto, sinal).

Existem variações no processo de padrões de janelas, como o que usa 4 cores, alternando o verde com o esmeralda, dois a dois e outros, no entanto o mais utilizado tradicionalmente é o do padrão Bayer. Este processo no entanto, como visto, acarreta perdas na definição de cores da imagem.

Um processo mais sofisticado (e dispendicioso) utiliza 3 CCDs, cada um para o registro independente de cada uma das 3 cores básicas. Também aqui várias técnicas foram tentadas e a em uso atualmente é a que emprega prismas. Um bloco de 3 prismas (chamado beam splitter) colados separa a imagem projetada pelas lentes em 3 novas imagens, idênticas à original exceto por um aspecto: cada uma delas possui somente uma das cores do sistema RGB. A função dos prismas, como visto adiante, não é separar as cores da luz (não confundir com a experiência de Isaac Newton) e sim atuar de maneira mais precisa nas diversas reflexões exigidas dos raios de luz durante o processo.

Estes, projetados pelas lentes da câmera, atingem a superfície do primeiro prisma e penetram dentro do mesmo. Para raios que incidem nesta superfície de maneira não perpendicular ocorre o fenômeno da dispersão, aqui bastante minimizado pelo material óptico com que é confeccionado o prisma. O que vai acontecer a seguir com os raios de luz depende do formato geométrico do prisma. No beam splitter não são utilizados prismas de reflexão total, o que significa que o raio de luz prossegue em sua trajetória até sair do mesmo. No entanto um 'truque' é utilizado para, neste ponto, separar os raios de luz de cor azul e não deixá-los passar adiante. Este 'truque' consiste em recobrir a face externa do primeiro prisma (a face que recebe primeiro a luz depois de a mesma ter penetrado em seu interior), com uma camada de material especial que age como se fosse um espelho dicróico. Espelhos dicróicos tem esse nome (di = dois, cróico = cor) devido à propriedade de separarem a luz conforme uma determinada cor escolhida: esta cor é refletida pelo espelho enquanto todas as demais seguem adiante em sua trajetória. O processo é semelhante ao que ocorre na superfície da janela de um veículo, escurecida com película protetora, só que no caso do veículo todas as cores são parcialmente refletidas para fora e parcialmente refratadas para dentro. Na camada dicróica isto só ocorre para uma determinada cor, para um determinado comprimento de onda de luz. Assim ocorre no beam splitter: a camada dicróica colocada externamente ao primeiro prisma faz com que os raios de cor azul sejam refletidos e os das demais cores prossigam saindo para fora do prisma. Estes raios azuis, após serem refletidos pela camada dicróica, sofrem uma segunda reflexão internamente no prisma, refletindo-se a seguir para baixo e saindo para fora do mesmo.

No entanto, por melhores que sejam os materiais empregados no processo, sempre algumas imperfeições (raios de luz de cor diferente de azul) podem ainda permanecer na saída. Para retê-las, os raios, ao saírem do prisma, atravessam um filtro azul, servindo assim para obter total pureza na cor azul. Após passar pelo filtro, os raios atingem o CCD destinado a tratar a cor azul. A separação da luz azul acima descrita pode ser observada na figura abaixo:

A parte dos raios de luz (de várias cores, exceto azul) entra agora no segundo prisma, que também possui uma de suas superfícies externas recoberta por uma camada dicróica semelhante à do primeiro, porém aqui refletindo somente a luz vermelha. Os raios de luz vermelha, após serem refletidos pela camada dicróica, sofrem uma segunda reflexão internamente neste segundo prisma e saem para fora do mesmo. Da mesma forma que ocorre para a cor azul, aqui também existe um filtro para conferir pureza à cor vermelha e um CCD específico para a mesma.

Finalmente, a parte da luz que prossegue é tratada por um filtro e um CCD destinado à cor verde. Os prismas utilizados no beam splitter poderiam ser trocados por espelhos e o beam splitter continuaria funcionando, porém a qualidade da reflexão dos raios de luz seria bem menor, devido às imperfeições naturais das superfícies espelhadas.

Espelhos dicróicos, como os utilizados no beam splitter, são empregados também em outras aplicações de tratamento de imagens, como em cinema por exemplo, onde equipamentos como o colour film analyser e o grader (utilizados no laboratório, na fase de pós-produção) utilizam 3 espelhos alinhados deste tipo para separar a luz branca de uma lâmpada nas 3 cores RGB: a separação permite o ajuste individual da intensidade de cada uma, que são posteriormente recombinadas e projetadas sobre a película (no caso do grader) permitindo geração na printer de uma cópia corrigida.

No beam splitter, os 3 CCDs são precisamente alinhados nas saídas, de modo que a imagem produzida por eles 'case' perfeitamente (se estiver sendo utilizado o processo horizontal pixel shift, o CCD correspondente ao verde é deslocado horizontalmente meio pixel).

Com este sistema ganha-se na precisão e na fidelidade da reprodução das cores, uma vez que o circuito eletrônico soma as 3 cores pixel a pixel e não através de blocos de pixels como no sistema de filtros coloridos. Câmeras avançadas do segmento semi-profissional e todas as do segmento profissional utilizam o esquema de 3 CCDs. As câmeras do segmento amador e semi-profissional geralmente possuem um único CCD, utilizando o padrão de filtros coloridos. O desenho abaixo ilustra a imagem captada com um sistema de 3 CCDs e com o sistema Bayer:

Em comparação com câmeras de 1 CCD, a luz em uma câmera de 3 CCDs percorre uma trajetória maior (entre as diversas refrações e reflexões). Este fato faz com que nestas câmeras a imagem tenha que ser formada mais distante da lente, situação mais favorável a lentes do tipo tele-objetiva. A focalização em modo super-grande angular é mais custosa e exige maior complexidade óptica do conjunto; por este motivo, suas lentes zoom costumam ser mais potentes no modo tele do que no modo grande-angular.

Devido às perdas nas diversas reflexões internas através dos prismas, câmeras com 3 CCDs necessitam em geral mais luz do que as com 1 único CCD para efetuar a gravação de imagens. É este um dos motivos da presença geralmente de equipamentos de iluminação nos trabalhos profissionais. Prismas do tipo beam splitter para uso em CCDs são fabricados por empresas como Fujinon e Cannon.

Sistemas de 3 CCDs são normalmente encontrados em câmeras de vídeo profissionais e não em câmeras fotográficas digitais profissionais devido a fatores como tamanho do bloco de prismas, exigência de maior distância entre as lentes e o local onde a imagem é formada e o custo de se ter 3 chips de alta resolução (chips de câmeras de vídeo não necessitam alta resolução, normalmente são empregados CCDs de 200.000 a 400.000 pixels cada em câmeras de 3 CCDs - o fator resolução é limitado pelo formato empregado, como Mini-DV, DVCAM, etc...).

Somente a quantidade total de pixels no(s) CCD(s) de duas câmeras não serve de parâmetro de comparação para se deduzir a qualidade da imagem; uma câmera com 1 CCD contendo mais pixels do que a soma dos pixels de outra com 3 CCDs não necessariamente produzirá imagem melhor, porque a quantidade de pixels é apenas um dos fatores que contribuem para a mesma.

Existem tamanhos padrão usuais para o tamanho dos CCDs, medidos em polegadas: 2/3 pol, 1/2 pol, 1/3 pol, 1/4 pol e 1/6 pol. (medidas efetuadas na diagonal). Em comparação com a área de um fotograma de película cinematográfica de 35mm e ainda mais com a área de um fotograma de um filme comum de fotografia de 35mm, a área dos CCDs é muito pequena, como pode ser observado na figura abaixo. O pequeno retângulo verde central é o CCD de uma câmera de vídeo, de onde foi retirada a objetiva:

Na realidade, no exemplo acima, por se tratar de câmera com 3 CCDs, a cor esverdeada indica que está sendo visualizado o CCD mais ao fundo, de cor verde, de acordo com o beam split anteriormente descrito.

A figura a seguir mostra a proporção exata dos diversos tamanhos usuais de CCDs e também uma comparação dos mesmos com alguns formatos mais comuns de películas cinematográficas. Tanto em vídeo como em cinema, quanto menor o tamanho da imagem formada pela objetiva, maior é aprofundidade de campo da mesma. Na verdade este fato decorre de um ajuste efetuado na distância focal das objetivas para que uma imagem com aspecto dito " normal " seja apresentada tanto na área do sensor/película menor quanto na área maior, com o mesmo ângulo de visão. Para que seja possível manter este ângulo na imagem formada em superfícies menores, a distância focal da lente, na posição "normal", tem que ser significativamente reduzida (tanto mais quanto menor a dimensão dessa área). O mesmo acontece com as posições "tele" (tele-objetiva) e "wide" ( grande angular ), no caso das objetivas zoom, comuns nesse tipo de equipamento.

Em outras palavras, todas as distâncias focais (wide / normal / tele) são diminuídas para formar as imagens em superfícies menores mantendo o mesmo ângulo de visão obtido nos equipamentos que formam imagens em superfícies maiores. E como a profundidade de campo é inversamente proporcional à distância focal, a mesma torna-se maior nos equipamentos que utilizam sensores e fotogramas em tamanho menor.

A profundidade de campo é controlada com bastante frequência na linguagem cinematográfica para obter-se efeitos estéticos de destaque de elementos diversos nas cenas. Pelos motivos acima expostos, este controle é normalmente mais difícil de se obter em vídeo com equipamentos dos segmentos consumidor e semi-profissional. Uma solução para contornar esse problema é o uso de dispositivos especiais denominados adaptadores de lentes 35mm.

Os primeiros CCDs continham pixels maiores do que os atuais e podia-se dizer que quanto maior o tamanho de um CCD melhor a imagem produzida. Atualmente no entanto a tecnologia é capaz de compactar cada vez mais um número maior de pixels em CCDs de dimensões menores (1/4 pol, 1/6 pol) de forma que nem sempre um CCD menor produz imagem com menor qualidade do que um maior. Existem ainda diversos outros tamanhos intermediários de CCDs em relação aos exibidos na figura, como  1/2,8  1/3,4  1/3,6  1/3,9  1/4,5  1/4,7  1/5,5  e outros.