Por: Sergio Arciniegas Alarcón
Generalmente en estos estudios se encuentra una respuesta diferencial de los cultivares en cada lugar que es llamada interacción genotipo por ambiente ó G E y que es bien explicada por modelos de efectos principales aditivos con interacción multiplicativa (AMMI). Frecuentemente, los experimentos G E pueden ser desbalanceados y uno o varios genotipos no son evaluados en algunos lugares. Algunas veces para el investigador recomendar los ambientes, puede ser de interés obtener las predicciones de aquellas combinaciones genotipo-ambiente que no fueron probadas y tales predicciones pueden ser calculadas explotando la información inherente a aquellas combinaciones que fueron actualmente obtenidas. Además del interés del investigador por estas predicciones, los datos faltantes pueden causar alguna modificación en la estimación clásica de los parámetros para los modelos AMMI, porque para estimar los parámetros es necesario un proceso secuencial haciendo un análisis de varianza con una posterior descomposición de valores singulares sobre la matriz de residuales, la cual no puede ser calculada si existe una matriz de interacción con información faltante. Para solucionar este problema la literatura ofrece una amplia variedad de métodos para predecir los datos faltantes, pero la mayoría de esos métodos hacen imputación simple y no involucran la incertidumbre de las imputaciones. En el tratamiento estadístico actual de información faltante, una de las mejores y más efectivas metodologías es la imputación múltiple, pero en general esta técnica tiene fuertes supuestos tanto estructurales como distribucionales sobre el conjuntos de datos. Son pocos los métodos de imputación múltiple libres de distribución en los experimentos G E y por esa razón el objetivo de este proyecto es proponer nuevas técnicas de imputación múltiple no paramétrica a partir de la teoría de validación cruzada.