a luz é uma onda eletromagnética. Medindo-se o comprimento de ondas deste tipo, pode-se verificar que o mesmo varia em larga escala, ou seja, existem vários tipos de ondas eletromagnéticas, cada qual com um comprimento específico. O maior comprimento de onda eletromagnética é encontrado nas ondas de eletricidade (utilizadas em energia e telefonia) e o menor nas ondas encontradas nos raios cósmicos existentes no espaço.

Dentro desse espectro de comprimentos de onda, apenas uma pequena faixa é visível ao olho humano, a faixa que vai de 400 nm (nanômetros, onde 1 nanômetro é 1 milímetro dividido por 1 milhão) a 700 nm. Estas dimensões correspondem a mais de uma centena de vezes menos do que o diâmetro de um fio de cabelo. Dentro dessa faixa, diferentes comprimentos de onda correspondem às diferentes cores do arco-íris: vermelho, alaranjado, amarelo, verde, azul, anil e violeta, onde o comprimento de 400 nm corresponde ao violeta e o de 700 nm ao vermelho:

Logo abaixo do comprimento 400 nm (350 nm) encontram-se as ondas do tipo ultravioleta e logo acima de 700 nm (750 nm) as ondas do tipo infravermelho, ambas já invisíveis ao olho humano (cobras podem enxergar a cor infravermelha, assim como insetos a ultravioleta). O quadro abaixo mostra alguns tipos de ondas eletromagnéticas e seus respectivos comprimentos de onda:

Utilizando um prisma, um cientista inglês chamado Sir Isaac Newton mostrou que a luz branca é na verdade a fusão de todas as outras cores. O prisma, ao receber um raio de luz branca de um dos lados, separa-os por comprimento de onda: os menores, típicos da faixa azulada (conforme figura do espectro visível acima) desviam-se mais do que os que tem maior comprimento, típicos da faixa avermelhada.

De todas as cores do arco-íris no entanto, o olho humano só é na realidade sensível a três delas: vermelho, verde e azul, componentes básicas do modelo de cor RGB . Isto porque no interior do olho existem estruturas minúsculas, dispostas como pastilhas aleatoriamente espalhadas em um mosaico, à semelhança dos pixels que formam a imagem vista pela câmera. Estas estruturas, na verdade células fotosensíveis espalhadas no fundo do olho (na retina), dividem-se em dois tipos: as sensíveis à luminosidade (denominadas bastonetes, cerca de 125 milhões delas em cada olho) e as sensíveis às cores (denominadas cones, com cerca de 7 milhões em cada olho). E existem somente 3 tipos de cones quanto à sensibilidade a cores: os que são sensibilizados pela cor vermelha, os que o são pela verde e os que o são pela azul. Todas as demais cores e tonalidades são enxergadas pelo olho como combinação em diferentes proporções destas 3 cores ou , em outras palavras, como combinação de sensibilização destes 3 tipos de estruturas do olho humano. Por este motivo estas 3 cores são denominadas cores primárias.

Assim por exemplo, quando a luz emitida por uma lâmpada amarela pendurada na árvore de Natal atinge o olho humano, esta luz irá sensibilizar igualmente os cones sensíveis ao vermelho e os sensíveis ao verde, porque a luz amarela é obtida como combinação em iguais proporções destas outras duas. Por outro lado, se nesta árvore colocarmos duas lâmpadas, uma vermelha e outra verde, uma colada à outra, e as observarmos de uma distância de onde as duas pareçam uma só, o olho perceberá a luz emitida pelas lâmpadas como amarela. Isto significa que um sistema de vídeo não precisa emitir luz amarela: o mesmo efeito é conseguido através de duas das cores básicas do modelo RGB e este é o princípio de funcionamento das câmeras e monitores de TV. A figura abaixo ilustra os cones e bastonetes no interior do olho humano:

Os cones são responsáveis por enxergar, além das cores, também a definição dos detalhes das imagens que vemos. No entanto, ao contrário dos bastonetes, os cones não tem muita sensibilidade à luz. É por este motivo que na penumbra temos dificuldade em enxergar tanto as cores quanto os detalhes das imagens, justamente as atribuições específicas dos cones: objetos que sob a luz do Sol durante o dia nos parecem bem coloridos, ficam pardos, acinzentados e com pouca definicao de detalhes. Já os bastonetes sofrem pouco com a falta de luminosidade; no entanto, além de não serem sensíveis às cores, garantem pouca definição às imagens: além de estarem presentes em menor número no olho, vários bastonetes são agrupados à mesma terminação nervosa, como mostra a figura. Isto é uma maneira de garantir maior sensibilidade à luz, mas ao mesmo tempo o agrupamento acarreta a perda de definição - individualização - dos pontos da imagem.

Pessoas que apresentam deficiência em determinados tipos de cones (sensíveis ao vermelho, verde ou azul) apresentam uma das formas de daltonismo. Já as que apresentam deficiência nos bastonetes apresentam a chamada cegueira noturna. Apesar dos cones serem responsáveis pela definição das imagens em termos de luminosidade (contornos e detalhes), sua resolução de cores é menor do que sua resolução em termos de luminosidade (são necessários 3 cones, sensíveis cada um a uma das 3 cores básicas, para que o cérebro combine suas informações e deduza a cor da área compreendida pelos 3. Esse é um dos motivos pelo qual a resolução horizontal de cor do sinal de vídeo não necessita ser igual à sua resolução de luminosidade, sendo menor do que esta.

A cor prata (ou a cor dos metais) na realidade não é propriamente uma cor, no sentido de comprimento de onda: tanto uma superfície branca como uma polida (prateada) reflete todas as cores que incidem sobre ela; no entanto, o modo de reflexão é que é diferente. Enquanto que a superfície branca reflete de maneira irregular todos os raios de luz que incidem sobre ela, na superfície polida essa reflexão é regular (quanto mais lisa e polida mais regular é) e por isso forma a imagem refletida, como um espelho.