Amostragem
O universo das sondagens regulares ICS/ISCTE é constituído por indivíduos com idade igual ou superior a 18 anos e com capacidade eleitoral activa residentes em Portugal Continental. A partir de uma matriz inicial de Região (5 regiões NUTII: Norte , Centro, Área Metropolitana de Lisboa, Alentejo e Algarve) e Dimensão do agregado populacional (5 grupos), são seleccionados aleatoriamente pontos de amostragem onde são realizadas as entrevistas, através da aplicação de quotas, de forma a que a distribuição dos respondentes corresponda à distribuição da população por Sexo (2 grupos), Escalão etário (4 grupos) e Instrução (3 grupos) em cada célula formada pelo cruzamento entre Região e Dimensão do agregado populacional.
Inquirição
A informação é recolhida através de entrevista direta e pessoal na residência dos inquiridos, em sistema CAPI (Computer-assisted Personal Interviewing). Os questionários podem ser consultados na página respectiva de cada estudo, mas têm geralmente quatro blocos principais: perguntas de caracterização sócio-demográfica e sócio-política; perguntas de avaliação da situação política e económica; um bloco temático que será diferente em cada estudo; e uma pergunta de intenção de voto, cujas respostas são recolhidas através de simulação de voto em urna.
Precisão dos resultados
Em vários gráficos apresentados nos relatórios dos estudos, as estimativas são apresentadas com “linhas de erro”. Estas linhas representam os “intervalos de confiança” a 95% para cada estimativa. Uma maneira simples de interpretar estas linhas de erro é dizer que elas contêm o conjunto de resultados que, com um elevado (mas não total) nível de confiança, são igualmente compatíveis com os dados recolhidos, presumindo amostragem aleatória. Para ir um pouco mais longe, pense-se da seguinte forma. Quando se usa uma amostra para estimar o valor de um determinado parâmetro numa população (por exemplo, a proporção de pessoas que diz tencionar votar no partido x), só se pode fazê-lo com algum grau de incerteza, ditado pelo facto de se estar a usar uma parte (observada) para fazer inferências sobre o todo (não observável). Sabe-se que, se se pudesse extrair um grande número de amostras aleatórias de igual dimensão e de uma mesma população, e se se estimassem intervalos de confiança a 95% em cada uma delas, 95% desses intervalos conteriam o valor real do parâmetro na população. A amostra de um dos nossos estudos no momento em que foi feito pode ser vista como uma dessas amostras, apesar de não se poder saber se ela pertence aos 95% dos casos que geram intervalos que contêm o valor real ou aos outros 5%. Para além disso, em rigor, este intervalo que é apresentado aplica-se estritamente a amostras aleatórias simples (o que não é o caso das amostras usadas nestes estudos) e não toma em conta todas as outras possíveis fontes de erro. Contudo, pode ser tomado como um valor de referência sobre o grau de incerteza mínimo associado a uma estimativa.
Pós-estratificação
Há variáveis socio-demográficas que se julga poderem estar correlacionadas com as atitudes e os comportamentos políticos e cuja distribuição na população conhecemos à partida para cada célula definida pelos múltiplos cruzamentos entre essas variáveis. É o que sucede com as que são utilizadas para definir quotas para as amostras destes estudos, com base em informação disponível através do Recenseamento da População. Noutros casos, contudo, conhecemos apenas com alguma precisão a maneira como a população como um todo se distribui pelos valores dessas variáveis. Há duas variáveis em particular que, na base da investigação existente (ver aqui, aqui, aqui ou aqui), sabemos estarem correlacionadas com atitudes e comportamentos políticos: a pertença a sindicatos e a prática religiosa (a frequência de assistência a serviços religiosos). Na base do Inquérito Social Europeu, a distribuição da população com 18 ou mais anos nestas variáveis é conhecida com alguma precisão e tem exibido estabilidade ao longo do tempo. Logo, quando a amostra recolhida no estudo exibir desvios estatisticamente significativos em relação a essas distribuições, a amostra será reponderada de forma a ajustar-se às distribuições conhecidas para essas variáveis na base da vaga mais recente do Inquérito Social Europeu.
“Indecisos” e não respostas
A percentagem de respondentes que declara não saber a resposta a uma determinada pergunta do questionário ou que se recusa responder-lhe é reportada nos relatórios e na documentação anexa. Contudo, no caso das intenções de voto, apresentam-se também os resultados de forma a que sejam comparáveis com resultados de uma eleição. Para que isso seja possível, é necessário tomar decisões sobre como tratar aqueles que dizem não saber se e como votariam, assim como aqueles que recusam responder à questão sobre intenção de voto. A prática mais comum para esse fim consiste em excluí-los da análise, o que é equivalente a pressupor que tencionam abster-se de votar ou a redistribuí-los proporcionalmente pelas restantes opções de resposta. Contudo, há alternativas a atribuir-lhes de forma arbitrária e determinística essa opção. O procedimento que será utilizado nestes estudos designa-se de “imputação múltipla”, e consiste em utilizar a informação recolhida através das respostas às outras perguntas no inquérito, as suas distribuições e relações entre si, para prever valores prováveis para as respostas em falta. Chama-se “múltipla” porque este exercício é repetido várias vezes, gerando várias bases de dados alternativas, que depois são combinadas na análise para gerar estimativas únicas (com os respectivos intervalos de confiança). Este artigo faculta uma breve introdução a esta técnica, desenvolvida originalmente por Donald B. Rubin.