Thursday, July 31, 2025

Not Everything That Glitters Is Science: Propaganda, Statistics, and Common Sense

 

Introduction

Having a beautiful woman recommend a cosmetic, an outfit, or a food product proves absolutely nothing. It’s not the product that made her beautiful — it’s her beauty that made her the choice for the commercial.

Exaggerated Claims in Advertising

Misleading comparisons are common, especially in beauty product ads. “I used to look like this… and now look at me after using the amazing shampoo X,” says the model. But think about it: how much of the transformation is due to the shampoo — and how much to the stylist, makeup artist, wardrobe, lighting, and photographer?

Advertising, by nature, exaggerates — it highlights the virtues and hides the flaws. And often it borrows the language of science to sound more convincing.

When Science Is Distorted

The COVID-19 pandemic was a striking example of how scientific evidence can be distorted. Chloroquine and hydroxychloroquine showed some effect in vitro, but were ineffective in clinical trials. Still, they were irresponsibly promoted — even by political figures.

The same happened with ivermectin. A meta-analysis of randomized trials showed no benefit in mortality, hospital stay, or viral load. Yet, it was widely publicized based on weak or misrepresented evidence.

The Illusion of Context-Free Numbers

In 2007, a Colgate ad in the UK claimed: “More than 80% of dentists recommend Colgate.” The public understood: '80% prefer Colgate'. Not true. Dentists were allowed to name multiple brands — and Colgate was simply one of the many mentioned.

The Case of Den-Den Chewing Gum

In the 1980s, Brazil saw the rise of a chewing gum called Den-Den. Its packaging claimed: “Helps prevent cavities... prevents 80% of cavities.” It contained chlorhexidine gluconate — a known antiseptic — but in trace amounts (0.02 mg per piece), and around 70% of the product was sugar.

Studies showed Den-Den had no significant anti-cavity or anti-plaque effect (Neder et al., 1981). By 1984, it was banned from sale. The dental association's journal mocked the episode with the editorial titled: *The Smile of the Chewing Gum*.

Skepticism and Common Sense

These cases show we must cultivate healthy skepticism — without falling into paranoia. We are not guardians of reason: we act today with yesterday’s knowledge, trying to shape tomorrow.

The 4W-2H Rule

Apply the 4W-2H rule when evaluating information:
• Who? Is the source an expert?
• Where? Where was the data collected?
• When? When was the research conducted?
• What? What was actually proven?
• How? How was the study conducted?
• How many? How much data supports the conclusion?

Propaganda vs. Publicity

Commercial propaganda aims to provoke an emotional — not rational — response. It’s more accurate to call it publicity. But propaganda isn’t inherently negative. Campaigns for vaccination, censuses, or charitable causes are examples of positive propaganda.

Final Thoughts

As Mark Twain once said: “Many small things have been made large by the right kind of advertising.” We just need to know how to distinguish good from bad — and not be misled by 'evidence' that proves nothing.

Sources and Further Reading

·  World Health Organization. Therapeutics and COVID-19: Living guideline. WHO, 2021.

·  Roman, Y. et al. Ivermectin for the treatment of COVID-19: A systematic review and meta-analysis of randomized controlled trials. Clinical Infectious Diseases, 2021.

·  ASA (Advertising Standards Authority). Colgate advertisement ruling, UK, 2007.

·  Neder, A.C. et al. Anti-cavity chewing gum (Preliminary note). Vida Odontológica, Vila Franca de Xirpa, Portugal. 8: p. 404, 1981.

·  Editorial: The smile of the chewing gum. Revista da Associação Brasileira de Odontologia (ABO Nac.), n. 2, Feb./Mar. 1994.

·  Vieira, S. Prevenção da cárie: a ética e a metodologia. Blog

·  Twain, M. The Tragedy of Pudd'nhead Wilson, 1894.

Nem tudo o que reluz é ciência: a propaganda, a estatística e o bom senso

 

Introdução

Mostrar uma moça bonita recomendando um cosmético, uma roupa ou um alimento não prova absolutamente nada. Não é o produto que a tornou bonita — é justamente o fato de ser bonita que fez com que fosse escolhida para a propaganda.

Propaganda e exagero

Comparações enganosas são comuns, principalmente em anúncios de produtos de beleza. “Eu era assim… e fiquei assim depois de usar o maravilhoso xampu X”, diz a modelo. Mas pare e pense: quanto da transformação se deve ao xampu, e quanto ao cabeleireiro, maquiador, figurino, iluminação, fotógrafo?

A propaganda apela para o exagero — exalta as virtudes, omite as limitações. E muitas vezes, mistura-se ao discurso científico para emprestar uma aparência de verdade às promessas.

Quando a ciência é distorcida

A pandemia da COVID-19 foi exemplo alarmante de manipulação de evidências. Cloroquina e hidroxicloroquina mostraram inibição in vitro do SARS-CoV-2, mas se revelaram ineficazes em humanos. Mesmo assim, foram promovidas irresponsavelmente, até por autoridades.

O mesmo ocorreu com a ivermectina. Uma metanálise de ensaios clínicos randomizados mostrou que ela não reduziu mortalidade, tempo de internação ou carga viral. Mesmo assim, ganhou notoriedade pela propaganda.

A ilusão dos números fora de contexto

Uma campanha publicitária da Colgate, no Reino Unido (2007), dizia: “mais de 80% dos dentistas recomendam Colgate”. O público entendeu: '80% preferem Colgate'. Mas a realidade é que os dentistas podiam citar várias marcas — e Colgate foi uma delas.

O caso do chiclete Den-Den

Nos anos 1980, surgiu no Brasil o chiclete Den-Den. A embalagem prometia: “ajuda a evitar a cárie... previne 80% das cáries”. O produto continha gluconato de clorexidina, mas em quantidade mínima (0,02 mg por tablete), e era composto em cerca de 70% por sacarose.

Estudos mostraram que o Den-Den não apresentou efeito anticariogênico nem antiplaca significativo (Neder et al., 1981). Em 1984, sua comercialização foi proibida. O editorial da Revista ABO ironizou o caso: *O sorriso do chiclete*.

Ceticismo e bom senso

Esses casos mostram que precisamos cultivar o ceticismo saudável — sem paranoia. Não somos paladinos da razão: decidimos hoje com o conhecimento de ontem, tentando construir o amanhã.

A regra 4W-2H

Use a regra 4W-2H ao avaliar informações:
• Who? Quem disse isso tem competência?
• Where? Onde foram obtidos os dados?
• When? Quando a pesquisa foi feita?
• What? O que foi comprovado?
• How? Como foi feito o estudo?
• How many? Quantos dados sustentam a conclusão?

Propaganda x Publicidade

A propaganda comercial busca provocar reação emocional — não racional. Por isso, é mais correto chamá-la de publicidade. Mas o termo propaganda não é necessariamente negativo. Campanhas de vacinação, censos e ações beneficentes são exemplos de propaganda positiva.

Considerações finais

Como disse Mark Twain: “muitas coisas pequenas se tornaram grandes graças ao tipo certo de publicidade”. Basta saber distinguir a boa da má propaganda — e não se deixar levar por “provas” que não provam nada.

Fontes e leituras adicionais

·        World Health Organization. Therapeutics and COVID-19: Living guideline. WHO, 2021.

·        Roman, Y. et al. Ivermectin for the treatment of COVID-19: A systematic review and meta-analysis of randomized controlled trials. Clinical Infectious Diseases, 2021.

·        ASA (Advertising Standards Authority). Colgate advertisement ruling, UK, 2007.

·        Neder, A.C. et al. Chiclete anticárie (Nota prévia). Vida Odontológica, Vila Franca de Xirpa, Portugal. 8: p. 404, 1981.

·        Editorial: O sorriso do chiclete. Revista da Associação Brasileira de Odontologia (ABO Nac.), n. 2, fev./mar. 1994.

·        Vieira, S. Prevenção da cárie: a ética e a metodologia. Blog pessoal.

·        Twain, M. The Tragedy of Pudd'nhead Wilson, 1894.

Monday, July 28, 2025

Standard Deviations Don’t Add Up. Why Not?

 

I received a kind email from a PhD student at UNICAMP — someone I don't know personally — pointing out what she considered a 'small calculation mistake' in my book Analysis of Variance (p. 47). According to her, the value of the coefficient of variation (CV) calculated in the example was incorrect.

Naturally, I went straight to check.

The example in the book presents an experiment with two treatments (A and B) and five replicates per treatment. The data are simple and were chosen solely to illustrate the ANOVA calculations. Both the dataset and the ANOVA table were designed for this didactic purpose.

Dataset


ANOVA table


However, the reader, who works in quality control, applied the procedures she was used to: she calculated the means and standard deviations of each group, as is common in process analysis. She obtained the following results:

Means and standard deviations

So far, so good. But as she continued reading, she found this sentence in the book: “One may be interested in relating the standard deviation to the mean, to assess the magnitude of dispersion relative to the magnitude of the mean. By definition, the coefficient of variation (CV) is the ratio of the standard deviation to the mean.”

Later in the same chapter, I also wrote: “In analysis of variance, the standard deviation is the square root of the residual mean square.”

Since the student didn’t perform the analysis of variance (which is not common in some fields), she didn’t have the error mean square (EMS) value. Instead, she took the mean of the standard deviations and divided it by the mean of the means to compute the CV. That calculation is incorrect.

The arithmetic mean differs from the quadratic mean. For two positive numbers, a and b, we have:

Equality holds only when a = b. Therefore, the average of two standard deviations is smaller than the square root of the average of their variances — unless those variances are equal.

In experiments with more than one group, as in the example, each group has its own variance. The correct way to calculate the overall standard deviation — and hence the CV — is by taking the square root of the weighted average of the variances.

In the context of ANOVA, the EMS represents the average of group variances. The formula for the coefficient of variation in this case is:

where ȳ is the overall mean of all data, and EMS is the residual mean square, calculated as:

where ESS is the error sum of squares, k is the number of groups, and r is the number of replicates per group.

This definition provides a consistent and meaningful estimate of the coefficient of variation.

When I wrote the book, I didn’t realize that the traditional definition of CV — “standard deviation divided by the mean” — could be misleading if the source of the standard deviation isn’t clearly explained.

The formula is only correct when dealing with a single sample or group. In experiments with multiple treatments, each with its own mean and variance, the overall standard deviation must come from the ANOVA — not from combining descriptive statistics across groups.

And this episode also taught me to write definitions more carefully.

This was the core of the student’s mistake: standard deviations don’t add — variances do.


Desvios-padrão não se somam. Por quê?

Recebi um e-mail de uma doutoranda da Unicamp — que não conheço pessoalmente — apontando, gentilmente, o que considerava um “pequeno erro de cálculo” no meu livro Análise de Variância (p. 47). Segundo ela, o valor do coeficiente de variação (CV) calculado no exemplo estaria incorreto.

Claro, fui direto conferir.

O exemplo do livro apresenta um ensaio com dois tratamentos (A e B) e cinco repetições por tratamento. Os dados são simples e servem apenas para ilustrar os cálculos da análise de variância (ANOVA). A tabela de dados e a tabela da ANOVA foram construídas com esse propósito didático.

Tabela de dados


Tabela da ANOVA


       No entanto, a leitora, que é da área de controle de qualidade, resolveu aplicar os      
       procedimentos que costuma usar: calculou as médias e os desvios-padrão de cada                    grupo, como se faz em análise de processos. Obteve os seguintes resultados:

Médias e os desvios-padrão

Tudo certo até aqui. Mas, ao prosseguir com a leitura do livro, ela encontrou o trecho em que afirmo: “Pode existir interesse em relacionar o desvio-padrão com a média, para se ter ideia da grandeza da dispersão em relação à média. Por definição, o coeficiente de variação (CV) é a razão entre o desvio-padrão e a média dos dados.”

Mais adiante, no mesmo capítulo, informo que: “Na análise de variância, o desvio-padrão é dado pela raiz quadrada do quadrado médio do resíduo.”

Como a doutoranda não fez a análise de variância (que não é usual em algumas áreas), ela não tinha o valor do quadrado médio do resíduo (QMR). Em vez disso, tomou a média dos desvios-padrão e dividiu pela média das médias para obter o CV. Esse cálculo está incorreto.

A média aritmética é diferente da média quadrática. Para dois números positivos a e b, segue-se que:

A igualdade só ocorre quando a = b. Portanto, a média de dois desvios-padrão é menor que a média das duas variâncias, a menos que essas variâncias sejam iguais.

Quando se trata de ensaios com mais de um grupo, como é o caso do exemplo, cada grupo tem sua própria variância. A maneira correta de calcular o desvio-padrão global — e, portanto, o CV — é usando a raiz quadrada da média das variâncias ponderadas.

No contexto da ANOVA, o QMR representa a média das variâncias dos grupos. A fórmula do coeficiente de variação, nesse caso, é:

 de todos os dados, e o QMR é o quadrado médio do resíduo, calculado por:

sendo SQR a soma de quadrados do resíduo, k o número de grupos e r o número de repetições por grupo.

Essa definição permite obter um valor consistente e comparável do coeficiente de variação.

Quando escrevi o livro, não percebi que a definição tradicional do CV — “desvio-padrão dividido pela média” — pode ser mal interpretada quando não se deixa claro de onde vem esse desvio-padrão.

A fórmula está correta somente quando se lida com uma única amostra ou grupo. Em ensaios com múltiplos tratamentos, cada um com suas médias e variâncias, o desvio-padrão do ensaio como um todo deve ser obtido da ANOVA, e não por simples combinação das estatísticas descritivas dos grupos.

       Este episódio me ensinou que é preciso escrever definições com mais cuidado. 



Saturday, July 26, 2025

Skewness in Data Distributions: An Introductory Discussion

 


1. What Is Skewness in a Data Distribution?


        ·      If the left tail is longer or more pronounced than the right, the distribution is said to have negative skewness.

        ·      If the right tail is longer, the distribution has positive skewness.

        ·      Otherwise, the distribution is symmetric.


Textbooks often include histograms to illustrate long tails and how extreme values can can shift the mean upward or downward.


Figure 1

Histograms showing skewness types (negative, symmetric, positive)



Source: David P. Doane & Lori E. Seward (2011) Measuring Skewness:

 A Forgotten Statistic? Journal of Statistics Education, 19 (2)


DOI: 10.1080/10691898.2011.11889611

2. Visual Tools for Assessing Skewness


Beyond histograms, several exploratory tools can help evaluate skewness:


      ·      Boxplots highlight dispersion and outliers.

      ·     Dotplots reveal distribution shape and sample size.

      ·     Stem-and-leaf plots preserve individual data points while showing distribution shape.


Figure 2

Boxplots and dotplots illustrating skewness and sample size


3. Mean, Median, and Mode: Where Is the Center?


The traditional textbook rule states:


       ·      If the mean > median, the distribution is right-skewed.

       ·      If the mean < median, it is left-skewed.


However, this rule may fail — specially for discrete or multimodal distributions.


Figure 3

Right skewness: mean greater than median

                      Source: von Hippel, P.T. (2005). Mean, Median, and Skew: Correcting a Textbook Rule. Journal of Statistics Education, 13(2). Link


Figure 4 

Right skewness even when mean is less than median


Source: von Hippel (2005), ibid.

4. Measuring Skewness: Pearson’s Coefficients


Since Karl Pearson (1895), statisticians have proposed various ways to quantify skewness.


            ·      Pearson’s First Skewness Coefficient (uses mode)

            ·      Pearson’s Second Skewness Coefficient (uses median)

Example

 

              Given a dataset with 

                         mean = 70.5

                         median = 80

                         mode = 85

                         standard deviation = 19.33 

            calculate both coefficients.


5. Caution with the Mode


Pearson's first coefficient relies on the mode, but the mode is not always reliable


                                                          Example


                                                    Set A: 1, 2, 3, 4, 5, 5 

The mode (5) does not reflect the center of the distribution.


Set B: 1, 2, 3, 3, 3, 3, 3, 3, 4.

 The mode (3)  clearly represents central tendency.


                  Avoid using the mode for skewness if it’s based on few values.

6. Interpreting Skewness Coefficients


The coefficient indicates both direction and degree of asymmetry:


          ·      Positive value → right-skewed.

          ·      Negative value → left-skewed.

          ·      Near zero →  symmetric.


The farther from zero, the stronger the skewness.

7. Statistical Moments and the Fisher–Pearson Coefficient


 Skewness can also be described using moments:


        ·     Second moment (m2) = variance:

       ·      Third moment (m3) = related to skewness :

       ·       Fisher–Pearson coefficient formula: 


Note: These formulas describe population parameters, not sample statistics.

So, they are rarely used in modern software.

8. The Adjusted Fisher–Pearson Coefficient (Used in Excel)


Modern software (e.g., Excel)  uses a bias-adjusted version for samples:

             

Example


Data: 3, 4, 5, 2, 3, 4, 5, 6, 4, 7.

Skewness = 0.359543 (decreases as sample size increases).

9. A Final Note on Symmetry Testing


Calculating skewness does not test for general symmetry Instead, it assumes the data come from a specific symmetric population (usually the normal distribution).