Tipos de pruebas de confiabilidad para el software

From Chess Moves
Jump to: navigation, search

Existen varios tipos de pruebas de confiabilidad para el software. La fiabilidad entre evaluadores, la confiabilidad de la mitad dividida, la confiabilidad de prueba-retratación y las pruebas de consistencia interna son algunos de los métodos más comunes utilizados. El éxito de estas pruebas depende de su capacidad para medir las tasas de falla en una cantidad razonable de tiempo. Estos métodos pueden ser costosos y requieren una planificación y gestión adecuadas. Después de establecer el objetivo de la tasa de falla, debe tener en cuenta sus suposiciones. A continuación, debe desarrollar funcionalidades y parches, y recopilar los resultados de cada prueba. Repita los pasos 3-6 hasta que haya alcanzado el objetivo.

Fiabilidad entre

Si usted es un estudiante, probablemente haya escuchado sobre las diferentes pruebas de confiabilidad entre evaluadores. Estas son pruebas en las que dos evaluadores dan diferentes puntajes para una sola muestra de escritura. A menudo, los dos evaluadores no están de acuerdo en muchos aspectos de la muestra de escritura. Para determinar la confiabilidad entre evaluadores, puede dividir el número de calificaciones dadas por dos evaluadores por el número total de observaciones. De esta manera, puede calcular el acuerdo porcentual entre los dos evaluadores. La medida más cruda del acuerdo entre evaluadores es del 86%. Esta prueba funciona bien con cualquier número de categorías.

La confiabilidad entre evaluadores es importante para evaluar la reproducibilidad de los datos, ya que estas pruebas pueden marcar la diferencia entre dos fuentes de información independientes. A menudo, las estimaciones de confiabilidad están dadas por varios métodos diferentes, incluidas las formas test-retest y paralelas, que implican el uso de diferentes evaluadores y mediciones en diferentes momentos. Sin embargo, debido a que las pruebas de confiabilidad entre evaluadores a menudo se usan en análisis estadísticos de diseños cuasi-experimentales, las diferentes estimaciones de confiabilidad pueden conducir a problemas.

Confiabilidad de la mitad dividida

Si una medida combina múltiples construcciones, la confiabilidad de la mitad dividida puede ser útil para evaluar su confiabilidad general. La confiabilidad de la mitad dividida es una herramienta particularmente útil cuando las pruebas miden la misma construcción. Si bien la confiabilidad de las pruebas de mitad dividida no es perfecta, aún tienden a mostrar una correlación razonable entre sí. Por lo general, la confiabilidad de la mitad dividida es más efectiva cuando la prueba contiene 100 elementos. Neo FFI, por ejemplo, mide la extraversión, el neuroticismo, la amabilidad, la conciencia y la apertura a la experiencia.

Las pruebas de confiabilidad de la mitad dividida son uno de los varios tipos de confiabilidad de consistencia interna. Las pruebas de confiabilidad de la mitad dividida requieren que los elementos de prueba investigen la misma área de conocimiento. Los elementos de prueba se dividen en dos mitades iguales, cada una de las cuales contiene diez elementos. Luego se calculan las correlaciones de estos dos conjuntos. La alta correlación entre los dos conjuntos de puntajes indica que la prueba mide la misma construcción. Los resultados de las pruebas de confiabilidad de la mitad dividida se comparan para determinar cuáles son los más confiables.

evalue interna

La consistencia interna es la capacidad de una prueba para medir la similitud entre dos elementos o construcciones. Por lo general, la prueba implica pedir a los encuestados que califiquen las declaraciones en función de su acuerdo con ese constructo. La correlación entre ítem promedio, o AIC, es un subtipo de consistencia interna. La correlación promedio de dos ítems se determina promediando sus coeficientes de correlación. La prueba es útil para analizar la consistencia de un cuestionario.

Un ejemplo de una prueba de consistencia interna es un cuestionario de aversión al riesgo financiero. Dos conjuntos de preguntas se asignan aleatoriamente a dos grupos de encuestados. Los encuestados luego toman ambas pruebas. Los resultados de ambos conjuntos indican buenas formas paralelas de confiabilidad. En contraste, la teoría de los mayores coeficientes de límite inferior se aplica a las puntuaciones que son explícitamente multidimensionales. El uso de un modelo estructural arbitrario con errores aditivos tiene sentido en algunas circunstancias, pero no es apropiado en todos los casos.

Fiabilidad test-retest

Al considerar la confiabilidad test-retest, uno debe tener en cuenta que algunas personas tienen habilidades cognitivas más débiles que otras. Por ejemplo, se espera que los pacientes esquizofrénicos tengan un estado mental más inestable que los sujetos normales. En consecuencia, las estimaciones de confiabilidad de los sujetos normales pueden ser problemáticos en entornos clínicos. Otras personas pueden ser menos estables, como los usuarios no fármacos. En tales casos, la fiabilidad test-retest es más importante que nunca.

La independencia de dos administraciones puede verse afectada por la memoria y el efecto de práctica. Estos dos efectos son el resultado de una administración de la prueba y otro tomado semanas o meses después. El lapso de tiempo entre las dos administraciones también es un factor para determinar el grado de memoria o efecto de práctica. Todos estos factores afectan negativamente la fiabilidad de prueba-retest. Por lo tanto, los investigadores deben reclutar más sujetos de los necesarios para los estudios de confiabilidad de prueba-Retest.