Um questionário tem validade quando mede o que propõe medir, ou seja, "acerta no alvo". Existem quatro tipos de validade: de face, de conteúdo, preditiva e de construção.
Validade de face é o grau com que
o questionário aparentemente mede o que se projetou que medir. A validade
de face é, em geral, determinada por:
a) especialistas no
assunto, que avaliam se o instrumento realmente mede o que foi projetado para
medir;
b) uma amostra de
respondentes, que indicam se o instrumento parece medir o que deveria medir.
Exemplo: Um exame de aritmética para a quarta série do ensino fundamental constituído de problemas de aritmética terá validade de face se, aparentemente, medir o conhecimento de aritmética que se ensina na quarta série do ensino fundamental. A validação do instrumento deve ser feita por professores dessa série e pelos alunos, que se submeterão ao exame.
Validade do conteúdo é a extensão com que as questões do questionário fornecem, em todas as dimensões, a informação que se quer obter.
Exemplo: Um questionário para avaliar candidatos a um emprego deve medir diversas dimensões como interesse, conhecimento e aptidão dos candidatos. Não teria validade de conteúdo o questionário que avaliasse somente o interesse dos candidatos em preencher a vaga.
Validade preditiva é a extensão com que os resultados de um questionário predizem futuros desempenhos. É, portanto, o grau com que os resultados do questionário estarão, possivelmente, correlacionados com medidas que serão obtidas no futuro.
Exemplo: O resultado de um teste de aptidão aplicado aos candidatos ao vestibular de uma Faculdade de Odontologia deve estar relacionado com o desempenho que os alunos terão na clínica, durante e depois do curso.
Validade de construção é o grau com que os resultados do questionário se correlacionam com os resultados obtidos de outra forma, mas que se sabe serem corretos, como expectativas baseadas na teoria ou, pelo menos, com uma medida inquestionável, de acordo com especialistas da área.
Exemplo: Gassen (1) comparou os resultados obtidos por meio de um questionário respondido em entrevista face a face para avaliar a disfunção temporomandibular com os resultados de um exame clínico que, sabidamente, mostra o grau de disfunção. Participaram da pesquisa 136 mulheres com idades que variavam de 18 até 54 anos, inclusive.
Exemplo: O Teste de Inteligência Stanford Binet é longo e exaustivo e exige alto grau de treinamento de quem o administra, mas é bem aceito como medida de inteligência. Se você quiser desenvolver um teste pequeno e fácil de QI, pode determinar a sua validade preditiva administrando seu teste a pessoas que já fizeram o Stanford Binet e, em seguida, determinar se os resultados obtidos pelo seu teste estão correlacionados com os resultados do Teste de Inteligência Stanford Binet.
Algumas observações
Existe relação entre validade de conteúdo e validade de face, embora os conceitos sejam diferentes. A validade de face é um conceito mais frouxo porque diz apenas se o instrumento “parece” válido. Já a validade de conteúdo exige avaliação de especialistas e, em geral, tratamento estatístico.
Também existe uma relação entre
validade preditiva e validade de construção, embora esses conceitos sejam
distintos. A validade preditiva diz respeito à capacidade de prever, ou seja,
quão bem os resultados de um questionário predizem comportamentos futuros. Já a
validade de construção requer uma avaliação imediata, utilizando outra medida
reconhecida do mesmo conceito, mesmo que não seja considerada um padrão
ouro.
Referência
1. GASSEN, W. S. Análise da
efetividade do questionário de Helkimo para avaliação da disfunção
temporomandibular. 2006. Dissertação (mestrado) Centro de Pós-Graduação CPO São
Leopoldo Mandic. Campinas.