Thursday, December 04, 2025

Split-plot vs. hierarchical design: how to choose the correct model for your experiment

 

In biological, agricultural and clinical research, we often encounter experiments where the same experimental unit is measured multiple times, or different parts of the same unit receive distinct treatments. These structures violate the assumption of independence of observations, requiring specific statistical approaches.

When the problem arises

Consider a crossover clinical trial to evaluate three treatments for cardiac arrhythmia. Each participant receives all treatments in random sequence, with washout periods between them to avoid carry-over effects. Each participant serves as a block.

 

More complex situations involve two levels of treatment: groups of units receive main treatments, while each individual unit receives multiple secondary treatments over time.

Practical example: tomato plant study

Imagine 30 tomato plants (plots) randomized to 5 fertilizer formulas (main treatments). Each plant receives two irrigation regimes (secondary treatments) in distinct periods:       

The split-plot model: when plots are heterogeneous

The split-plot design is appropriate when there is natural variability between experimental units (plots). This model explicitly considers two error levels:

·       Error (a): Variability between plots within the same main treatment

·       Error (b): Variability within plots (between subplots)

Statistical model:

ANOVA Table - Split-Plot Design                                                      

Note on F tests: In split-plot, the test for main treatments uses Residual (a) as the denominator, while the tests for secondary treatments and interaction use Residual (b). This distinction is essential for valid conclusions..

The hierarchical model: when homogeneity is assumed

In situations where plots can be considered perfectly homogeneous, the hierarchical (nested) model is more appropriate.

Practical example: coffee quality study

Evaluation of coffee quality from four different origins. From each origin, we sample four bags, and from each bag we perform three laboratory analyses:

Critical assumption: coffee within bags from the same origin is homogeneous.

Statistical model:

where tij represents the effect of the j-th secondary treatment nested within the i-th main treatment.

                                  ANOVA TABLE - nested design

Comparative Table: Split-Plot vs. Hierarchical

Practical Conclusions

1.   Choose split-plot when your plots are naturally variable biological or experimental units (animals, people, individual plants, production batches).

2.   Prefer the hierarchical model only when there is strong evidence or valid assumptions about plot homogeneity (e.g., aliquots of the same solution, subsamples of homogeneous material).

3.   Warning! Incorrect application of the hierarchical model to data with between-plot variability results in variance underestimation and falsely significant tests.

Final Considerations

The choice between these models is not merely technical but conceptual. It reflects our understanding of the nature of the experimental material and the variation structure present in the data. When in doubt, the split-plot model is generally more conservative and appropriate, as it does not assume homogeneity where it may not exist.

Historical note: This discussion dates back to classical works in experimental statistics but remains surprisingly relevant in the era of mixed models and multilevel analyses.


Wednesday, December 03, 2025

Split-plot vs. delineamento hierárquico: escolha o modelo correto para seu experimento

 

Em pesquisas biológicas, agronômicas e clínicas, frequentemente nos deparamos com experimentos nos quais a mesma unidade experimental é medida múltiplas vezes, ou diferentes partes da mesma unidade recebem tratamentos distintos. Essas estruturas violam a pressuposição de independência das observações, exigindo abordagens estatísticas específicas.

Quando o problema surge

Considere um ensaio clínico cruzado (crossover) para avaliar três tratamentos para arritmia cardíaca. Cada participante recebe todos os tratamentos em sequência aleatória, com períodos de "washout" entre eles para evitar efeito residual (carry-over effect). Cada participante funciona como um bloco. 

Situações mais complexas envolvem dois níveis de tratamento: grupos de unidades recebem tratamentos principais, enquanto cada unidade recebe diferentes tratamentos secundários.

Exemplo prático: Estudo com tomateiros

Imagine 30 tomateiros (parcelas) randomizados para 5 fórmulas de fertilizantes (tratamentos principais). Cada tomateiro recebe dois regimes de irrigação (tratamentos secundários) em períodos distintos:

O modelo split-plot: quando as parcelas são heterogêneas

O delineamento em parcelas subdivididas (split-plot design) é apropriado quando existe variabilidade natural entre as unidades experimentais (parcelas). Este modelo explicitamente considera dois níveis de erro:

    o   Erro (a): Variabilidade entre parcelas dentro do mesmo tratamento principal

    o   Erro (b): Variabilidade dentro das parcelas (entre subparcelas)

  Modelo estatístico:

         O esquema para a ANOVA é:

      O modelo hierárquico: quando a homogeneidade é pressuposta

Em situações onde as parcelas podem ser consideradas perfeitamente homogêneas, o modelo hierárquico (aninhado) é mais apropriado.

Exemplo: Avaliação da qualidade do café de quatro procedências diferentes. De cada procedência, amostramos quatro sacas, e de cada saca realizamos três análises laboratoriais:


Pressuposição crítica: o café dentro de sacas da mesma procedência é homogêneo.

Modelo estatístico:

          onde m é a média geral, gi são efeitos dos tratamentos principais,
         tij efeitos dos tratamentos secundários dentro de tratamentos principais e 
         eijk erros aleatórios independentes com distribuição normal de média zero e

  variância s2.



             O esquema para a ANOVA é: 

Tabela Comparativa: Split-Plot vs. Hierárquico

Conclusões Práticas

    1. Escolha o split-plot quando suas parcelas são unidades biológicas ou experimentais naturalmente variáveis (animais, pessoas, plantas individuais, lotes de produção).

      2. Prefira o modelo hierárquico apenas quando houver fortes evidências ou pressuposições válidas sobre a homogeneidade das parcelas (ex.: alíquotas de uma mesma solução, subamostras de material homogêneo).

        3.   Atenção! A aplicação incorreta do modelo hierárquico a dados com variabilidade entre parcelas resulta em subestimação da variância e testes falsamente significativos.

Considerações Finais

A escolha entre esses modelos não é apenas técnica, mas conceitual. Ela reflete nosso entendimento sobre a natureza do material experimental e a estrutura de variação presente nos dados. Quando em dúvida, o modelo split-plot é geralmente mais conservador e apropriado, pois não assume homogeneidade onde ela pode não existir.

Nota sobre os testes F: No split-plot, o teste para tratamentos principais usa o Resíduo (a) como denominador, enquanto os testes para tratamentos secundários e interação usam o Resíduo (b). Esta distinção é essencial para conclusões válidas.

Nota histórica: Esta discussão remonta a trabalhos clássicos da estatística experimental, mas permanece surpreendentemente relevante na era dos modelos mistos e das análises multimível.