METODOLOGÍA DE LA INVESTIGACIÓN
Miguel Ángel Villasís-Keever,1 María Guadalupe Miranda-Novales2
1Instituto Mexicano del Seguro Social, Centro Médico Nacional Siglo XXI, Coordinación de Investigación en Salud, Hospital de Pediatría, Unidad de Investigación en Epidemiología Clínica. Ciudad de México, México.
2Instituto Mexicano del Seguro Social, Centro Médico Nacional Siglo XXI, Coordinación de Investigación en Salud, Hospital de Pediatría, Unidad de Investigación en Epidemiología Hospitalaria. Ciudad de México, México.
How to cite this article: Villasís-Keever MA, Miranda-Novales MG. [The research protocol IV: study variables]. Rev Alerg Mex. 2016 Jul-Sep;63(3):303-310
The variables in a research study are all that is measured, the information collected, or the data that is collected in order to answer the research questions, which are specified in the objectives. Their selection is essential to the research protocol. This article aims to point out the elements to be considered in the section of the variables. To avoid ambiguity, it is necessary to select only those that will help achieve the study objectives. It should subsequently be defined how they will be measured to ensure that the findings can be replicated; it is therefore desirable to include conceptual and operational definitions. From the methodological point of view, the classification of variables helps us understand how the relationship between them is conceptualized. Depending on the study design, the independent, dependent, universal, and confounding variables should be noted. Another indispensable element for planning statistical analyses is the scale of variable measurement. Therefore, one must specify whether the variables correspond to one of the following four: qualitative nominal, qualitative ordinal, quantitative range, or quantitative ratio. Finally, we should detail the measurement units of each variable.
Keywords: Measurements, methods and theories; Protocols; Statistics as topic
Este artículo debe citarse como: Villasís-Keever MA, Miranda-Novales MG. El protocolo de investigación IV: las variables de estudio. Rev Alerg Mex. 2016;63(3):303-310
Las variables en un estudio de investigación constituyen todo aquello que se mide, la información que se colecta o los datos que se recaban con la finalidad de responder las preguntas de investigación, las cuales se especifican en los objetivos. Su selección es esencial de los protocolo de investigación. Este artículo tiene como propósito señalar los elementos que deben considerarse en la sección de las variables. Para evitar ambigüedad, es necesario seleccionar sólo aquellas que ayudarán a concretar los objetivos del estudio. Posteriormente debe definirse cómo serán medidas para que los hallazgos puedan ser reproducidos; para ello es conveniente incluir las definiciones conceptuales y operacionales. Desde el punto de vista metodológico, la clasificación de las variables ayuda a entender cómo se ha conceptualizado la relación entre estas. Conforme al diseño del estudio, se deberá señalar las variables independientes, dependientes, de confusión y universales. Otro elemento indispensable para la planificación de los análisis estadísticos por realizar es la escala de medición de las variables. Por ello, se debe especificar si las variables corresponden a una de las siguientes cuatro: cualitativa nominal, cualitativa ordinal, cuantitativa de intervalo o cuantitativa de razón. Finalmente, se deben detallar las unidades de medición de cada variable.
Palabras clave: Mediciones, métodos y teorías; Protocolos; Estadística como asunto
Abreviaturas y siglas
IMC, índice de masa corporal
Las variables en un estudio de investigación son todo aquello que medimos, la información que colectamos, o bien, los datos que se recaban con la finalidad de responder las preguntas de investigación, las cuales habitualmente están especificadas en los objetivos. Al estar escribiendo el protocolo, en particular cuando se plantean los objetivos del estudio, se deben elegir las variables que se van a medir. Como se ha mencionado en los artículos previos de esta serie, los objetivos deben escribirse claramente especificándose la manera en que se pretende responder a las interrogantes, pero mencionándose también las variables. Por ejemplo, si el objetivo general es “medir la ingesta de bebidas azucaradas” o “establecer la asociación entre la ingesta de bebidas azucaradas con el sobrepeso/obesidad”, en los objetivos específicos el investigador debe ser más explícito respecto a cómo se medirá o cuantificará la ingesta de bebidas azucaradas: “medir la cantidad de azúcar de acuerdo con la especificación de las bebidas que ya la contienen (refrescos, jugos envasados, etcétera), y cuando el azúcar se agrega a otras bebidas (café, tizanas, agua de frutas, etcétera)”. Con lo anterior, se pretende que el investigador describa los objetivos en términos medibles.
Después de mencionarlas en los objetivos, los autores deberán anotar detalladamente cada una de las variables a medir en una sección específica dentro del protocolo. En este artículo describiremos cada uno de los elementos que debe contener el apartado de variables, dentro del protocolo de investigación.
Una vez que se han seleccionado las variables a estudiar, es necesario que dentro del apartado correspondiente se señale con claridad cómo serán medidas. Lo anterior es porque cada variable puede tener representaciones similares; por ejemplo, la obesidad puede ser evaluada de acuerdo con el peso para la edad, mediante el índice de masa corporal (IMC), la cuantificación del perímetro de cintura, o el porcentaje de grasa corporal.
Todas estas formas pueden ser correctas; sin embargo, es esencial considerar que al definir cada variable los investigadores contribuyen a que el estudio pueda ser replicado para obtener resultados similares, o para la aplicación de los hallazgos obtenidos en pacientes con características semejantes. También hay que tener en cuenta que puede tener implicaciones sobre la validez del estudio, ya que la manera que se eligió para medir la(s) variable(s) tal vez no sea la más aceptada en el mundo.
Por lo anterior, en todo proyecto de investigación es requisito fundamental que se definan cada una de las variables a estudiar y se tomen en cuenta dos aspectos principales: la definición conceptual y la definición operacional. La primera se refiere a cómo se concibe dicha variable; con frecuencia esta definición corresponde al significado más parecido a lo descrito en un diccionario o en un libro de texto. Por ejemplo, la definición de obesidad que uno puede encontrar es diversa: “adiposidad”, “exceso de grasa en el organismo”, “acumulación anormal o excesiva de grasa que puede ser perjudicial para la salud”, o simplemente “sobrepeso”. Ante esta variación, el investigador deberá seleccionar aquella más cercana a lo que desea medir.
En contraste, la definición operacional (también llamada operativa o de trabajo) delimita la manera en que realmente será medida una variable determinada. Para lograrlo, el investigador debe formularla en términos de hechos objetivamente observables, suficientemente claros y explícitos para evitar ambigüedades o interpretaciones diferentes. Si es pertinente, especificar el método por el cual la o las mediciones serán obtenidas. Si se toma el mismo ejemplo de la obesidad en adultos, la definición operacional pudiera escribirse de esta forma: “IMC ≥ 30”, o bien, “circunferencia de cintura ≥ 88 cm para las mujeres y ≥ 102 cm para los hombres”. Si el estudio fuera en niños, entonces se podría utilizar: “IMC ≥ percentil 95”.
Un punto a destacar es que en todo protocolo de investigación es importante especificar la manera o los métodos para identificar que los pacientes tienen una enfermedad determinada, un estadio de la enfermedad, una complicación o una comorbilidad, lo cual es un aspecto diferente de la definición de las variables. Si bien, como ya se comentó en un artículo previo de esta serie, esta parte pudiera estar mencionada en los criterios de selección (particularmente en criterios de inclusión y exclusión) de la población a estudiar, es común observar que los investigadores incluyan las definiciones de la enfermedad en el apartado de las variables.
Se debe tener en cuenta que las condiciones de los pacientes al momento del ingreso a un estudio corresponden a una “constante”, lo cual no parece congruente con el concepto de “variable” donde el común denominador será que tendrá más de una opción de respuesta. Esta situación no es un error, al contrario, le confiere mayor validez al protocolo de investigación. En cualquier investigación es necesario detallar —según corresponda— los aspectos clínicos, de laboratorio o de exámenes histopatológicos de cómo se llegó a la conclusión de que dicho paciente o sujeto en estudio (porque puede ser alguien “sano”) cumple objetivamente con los criterios de selección.
Por lo anterior, cuando sea conveniente, se recomienda que al escribir el protocolo de investigación se agregue un apartado de “definición de enfermedad” para ser más explícitos en los métodos a seguir, incluyendo definición conceptual y operacional.
De acuerdo con el diseño de investigación seleccionado para comprobar las hipótesis planteadas, las variables a medir deberán clasificarse desde el punto de vista metodológico. Para fines prácticos, en este artículo mencionamos que, en términos generales, existen cuatro tipos de variables: dependiente, independiente, de confusión y universal. Sin embargo, conviene señalar que no todos los estudios o diseños de investigación contienen las cuatro.
Variable dependiente
En todos los estudios de investigación clínica existe la variable dependiente. Esta tiene sinónimos como principal, de interés, de desenlace, de resultado o predicha. De acuerdo con el tipo de diseño señalamos que en los estudios descriptivos —donde solo se pretende señalar las características de la población: edad, sexo, condición socioeconómica, tipo de enfermedad, gravedad, etcétera— todas las variables a medir se pueden considerar dentro de esta categoría.
Ahora bien, si el diseño corresponde con un ensayo clínico donde se investiga si una intervención (o maniobra experimental) tiene alguna utilidad, entonces el efecto corresponderá a la variable dependiente; por ejemplo, al tratar de determinar la influencia de la disminución en la ingesta de sodio sobre las cifras de la tensión arterial, los cambios en la tensión arterial sistólica y diastólica corresponden a la(s) variable(s) dependiente(s).
Por otro lado, cuando nos enfrentamos a la búsqueda de factores de riesgo, o de causas para que ocurra una enfermedad o una complicación, la variable dependiente se considera el resultado. Ejemplo: si se quiere identificar que el tabaquismo o el ejercicio son factores de riesgo para cuadros de crisis asmática, entonces los pacientes con (o sin) crisis asmática corresponden a la variable dependiente.
En los estudios de pronóstico, donde el objetivo principal es establecer cómo será la evolución de un grupo de pacientes en un tiempo determinado, la variable dependiente corresponderá a la evolución, es decir, si los pacientes vivieron, murieron, hubo curación, complicación, recaída, o bien, cómo fue su calidad de vida, entre otras.
Variable independiente
En los estudios de investigación, la(s) variable(s) independiente(s) se deben considerar cuando se pretende determinar la relación entre al menos dos variables: la independiente y la dependiente. Así, en general, tendrán que estar incluidas en estudios comparativos o analíticos, ya que los investigadores desean observar el efecto (positivo o negativo) de la variable independiente sobre la dependiente.
La variable independiente también tiene sinónimos, como variable predictora o “que el investigador manipula”. A continuación se señalan ejemplos de acuerdo con los diseños de estudio: en el ensayo clínico descrito arriba, la intervención (disminución de ingesta de sal) corresponde a la variable independiente. De esta forma se formarán dos grupos: al primero o grupo experimental se le darán indicaciones para que disminuya la ingesta de sal, mientras que al segundo o grupo control, no habrá restricción de sal. Si después del estudio se comprueba que hubo mejor control de las cifras de tensión arterial en el grupo experimental, entonces se concluirá que la disminución de la ingesta de sal es benéfica.
Para el caso de los estudios de causalidad, el o los factores de riesgo corresponderá(n) a la(s) variable(s) independientes. En el ejemplo, el tabaquismo y el ejercicio son los posibles factores de riesgo asociados con una crisis asmática. Por su parte, en los estudios de pronóstico existen ciertas características en el momento del diagnóstico que pueden modificar la evolución de los pacientes. Por ejemplo, en pacientes con cáncer la probabilidad de mortalidad es mayor cuando tienen una mayor gravedad o extensión de la enfermedad, es decir, los pacientes con estadio I o II teóricamente tendrán un porcentaje menor de fallecer que aquellos en estadios III o IV. De esta forma, el estadio de la enfermedad corresponde a la variable independiente.
Variable de confusión
En los estudios donde se pretende determinar la relación entre la variable independiente y la dependiente es posible que los resultados no sean tan reales porque existen factores o circunstancias del paciente que pueden modificar los resultados. Esos factores constituyen las variables de confusión. Para comprender mejor este tipo de variables, tomaremos en cuenta los ejemplos que hemos descrito:
En el caso del ensayo clínico, a pesar de determinar la existencia de un efecto benéfico sobre la tensión arterial secundaria a la disminución en la ingesta de sal, es posible que estos resultados puedan ser distintos al incorporar las modificaciones en el peso corporal durante el tiempo de duración del estudio. En este sentido es posible que quienes tuvieron mejores cifras tensionales también hayan bajado de peso y viceversa, independientemente de la ingesta de sal. Al hacer el análisis de la información, si se comprueba que el peso influye en el cambio de las cifras de tensión arterial, se establece que el peso es una variable de confusión.
En el ejemplo de estudio de causalidad, la exposición a alérgenos constituye una variable de confusión, es decir, aunque se comprobara que el tabaquismo influye en los cuadros de crisis asmática, es necesario medir dicha exposición porque es conocida también la asociación de alérgenos con la presencia de exacerbaciones. Por último, en estudios de pronóstico también pueden existir variables de confusión; en casos de cáncer la presencia de infecciones graves puede relacionarse directamente con la mortalidad, de esta forma puede haber pacientes en estadio I o II que fallecen por este tipo de infecciones. En este sentido, el desarrollo de infecciones graves constituye una variable de confusión.
Variables universales
En todo estudio de investigación se incluyen ciertas condiciones de los pacientes o sujetos de estudio, las cuales ayudan a disponer de un panorama general de la población estudiada. A estas características se les denomina variables universales o descriptoras. Este grupo de variables se deben contemplar en cualquier investigación, es decir, tanto en estudios descriptivos como comparativos.
Este grupo incluye generalmente edad, sexo, nivel socioeconómico, escolaridad, lugar de residencia, estado civil, religión, raza, entre otras. Sin embargo, se debe tener en cuenta que algunas de estas variables pueden estar consideradas como independientes; por ejemplo, cuando se pretende evaluar los factores de riesgo de infarto al miocardio, es muy conocido que los pacientes masculinos tienen mayor probabilidad de presentar esta condición. En este último ejemplo, el sexo corresponde a una variable independiente y no a una variable universal.
La forma de clasificar cada una de las variables seleccionadas de acuerdo con su escala de medición es fundamental para la sección de variables, lo cual es parte del proceso para establecer su definición. Cuando el investigador especifica esta característica en cada variable, entonces estará en posibilidad de planear su análisis estadístico, ya que de acuerdo con la escala de medición existe una prueba estadística diferente. Es importante mencionar que para otros autores el concepto de escala de medición de variables significa lo mismo que “tipo de datos”, lo cual puede crear confusión con el “tipo de variable” desde el punto de vista metodológico —como ya lo describimos— por esta razón sugerimos utilizar el término escala de medición.
Las escalas de medición disponibles en la actualidad datan de 1946 y son cuatro: nominal, ordinal, de intervalo y de razón. Con el trascurso del tiempo algunas de ellas se han denominado de manera distinta, pero son sinónimos. En general, las escalas nominal y ordinal se pueden agrupar en cualitativas, mientras que las de intervalo y de razón en cuantitativas.
Los atributos que debe contener una escala de medición es que sea apropiada para el fenómeno en estudio y para la manera como está descrita en la definición operacional de la variable. También debe ser suficientemente poderosa para responder satisfactoriamente a los objetivos del estudio, es decir, una variable es más sólida cuando su escala es cuantitativa que cuando es cualitativa. Asimismo, es preferible una variable ordinal a una nominal, o bien, una de razón a una de intervalo; por supuesto, todo depende de lo que se medirá. Por otro lado, las categorías o unidades de medición deben ser mutuamente excluyentes entre sí para que no se traslapen; dichas categorías deben ser suficientes para el fenómeno a estudiar y claramente definidas.
En general, siempre que sea posible, es más conveniente la inclusión de variables cuantitativas, debido no solamente a que los análisis estadísticos a realizar serán más sólidos, sino que será posible observar el fenómeno en estudio con mayor precisión o con diferentes perspectivas. Por ejemplo, cuando se evalúa un tratamiento para la diabetes o un antihipertensivo, la disminución en los valores de la hemoglobina glucosilada o en las cifras de la tensión arterial permitirá observar la magnitud del cambio con el inicio del consumo del fármaco.
La variable continua contiene mayor información, y así será posible realizar un estudio con mayor poder y una muestra de menor tamaño, pero que además puede ser modificada a una escala “menor”, es decir, se puede convertir para disponer de otra manera para analizar el estudio. De esta forma, las cifras de hemoglobina glucosilada o de tensión arterial pueden ser usadas para clasificar a los pacientes como controlados o no controlados. Así, se pasó de una escala cuantitativa a cualitativa, lo cual no es posible realizar de manera inversa (de una cualitativa a cuantitativa).
Las variables con escala de medición nominal (también conocidas como variables categóricas) son aquellos fenómenos que por su naturaleza no pueden cuantificarse, o bien, que para su medición se clasifican en categorías. La característica esencial de las variables nominales es que sus valores son similares entre sí, dicho de otra manera, no siguen un orden, su magnitud es semejante y el listarlas de una forma u otra no modifica la relación entre ellas. Por ejemplo, para el grupo sanguíneo, ninguno de los grupos (A, B, O, o bien, Rh positivo o negativo) tiene mayor o menor valor o peso.
En las variables nominales también se pueden distinguir dos grupos: las variables dicotómicas, conocidas también como binarias, y las politómicas. Las variables dicotómicas tienen solo dos valores posibles o unidades: vivo/muerto, femenino/masculino, enfermo/no enfermo. Mientras que las variables nominales politómicas tienen tres o más unidades: los nombres de las enfermedades, el lugar de residencia o el estado civil.
Las variables con escala de medición ordinal —a diferencia de las nominales— tienen unidades o valores y siguen cierto orden, por ejemplo: deshidratación leve, moderada y grave. Sin embargo, el orden solamente manifiesta que una es mayor que otra pero dicha cualidad no es tan precisa como para establecer con exactitud la diferencia entre una y otra unidad, es decir, los intervalos entre ellas no son equivalentes, pero su identificación como variable ordinal indica dirección.
Otros ejemplos en medicina son cuando se utilizan cruces (+, ++, +++, ++++) para describir proteinuria en un examen de orina, o los estadios de las enfermedades (estadios I, II, III, IV). También son considerados en este grupo el grado de escolaridad y el nivel socioeconómico, o bien, es común utilizar una escala como la de Likert, en la que existen varios niveles de respuesta que pueden ir desde “totalmente en desacuerdo” a “totalmente de acuerdo”. Otros ejemplos que vemos comúnmente son los cuestionarios estandarizados que se emplean para evaluar la satisfacción o la calidad de vida.
En el caso de las variables con escala de medición de intervalo son variables cuantitativas, que tienen características particulares. Estas tienen los siguientes sinónimos: discretas, discontinuas, intervalares o finitas. En este grupo, los intervalos en las diferentes categorías o unidades son iguales entre sí, pero la magnitud del atributo no tiene la misma dimensión, por ejemplo, al comparar una temperatura de 10° con una de 20°, no se puede decir que es “la mitad o el doble de calor”; tienen un número limitado de unidades (de ahí el concepto de finito); el cero tiene un valor arbitrario; y pueden tener valor positivos y negativos. Ejemplos de estas variables son la temperatura, el IMC, el coeficiente intelectual, los niveles económicos con valores muy claramente establecidos, el número de hijos, de embarazos o de semanas de gestación.
Las variables de razón también tienen sinónimos: cuantitativas continuas o infinitas. Las características de estas variables son las siguientes: el cero corresponde a la ausencia de lo que se mide; tanto los intervalos como la magnitud son iguales entre cada unidad y confieren la posibilidad de dividirlas, conservándose siempre equidistantes los intervalos (kilómetros, metros, centímetros, milímetros, etcétera); se puede considerar que no tienen límites, de ahí que se conozcan como infinitas; y, para fines prácticos, se puede considerar que solo corresponden a peso (kilos, gramos, miligramos), distancia (metros, centímetros), volumen (litros, mililitros) y tiempo (horas, días, meses, años).
Finalmente, un elemento que deberá ser incluido en el apartado de variables del protocolo, para ayudar a ser más precisos en la forma como se va a medir cada variable es la descripción detallada de las unidades o categorías que se registrarán en la hoja de recolección de datos o en la base de datos. Lo anterior debe corresponder, en general, con la escala de medición de las variables. Como se mencionó, cada una de las opciones de la variable debe estar especificada, y todas deben ser suficientes y exhaustivas para que puedan ser clasificados todos los sujetos de estudio. En el Cuadro 1 se dan ejemplos de acuerdo con la escala de medición.
Cuadro 1. Ejemplos de variables en los protocolos, según la escala de medición | |
Nombre de la variable | Unidades o categorías |
Variables nominales | |
Sexo | Masculino/ Femenino |
Estado civil | Soltero/casado/viudo/divorciado/concubino |
Tipo de enfermedad subyacente | Enfermedad renal/ diabetes mellitus/artritis reumatoide |
Variables ordinales | |
Estado de nutrición | Desnutrido/bien nutrido/sobrepeso/obesidad |
Grado de desnutrición | Primer/segundo/tercer grado |
Estadio de la enfermedad neoplásica | I/II/III/IV |
Grado de satisfacción | Muy insatisfecho/insatisfecho/ ni insatisfecho ni satisfecho/satisfecho/muy satisfecho |
Variables de intervalo | |
Días de hospitalización | Número |
Número de embarazos | Número |
Temperatura | Grados Celsius |
Ingreso mensual en pesos | 0-5000/5.001-10 000/10 001-15 000/15 0001-20 000 |
Grasa corporal | Porcentaje |
Variables de razón | |
Edad al momento del diagnóstico | Años cumplidos |
Peso | Kilogramos |
Perímetro de cintura | Centímetros |
Cantidad de líquido de diálisis | Mililitros |
Un último aspecto a considerar al elaborar el apartado de variables, es la forma de recolección de datos para disponer de la información necesaria y responder a la pregunta de investigación. En términos generales, la hoja de recolección de datos o la base de datos debe contener el valor “crudo” de la medición obtenida, sin embargo, este dato puede no corresponder a la variable en estudio. En otras palabras, no todo lo que se registra es una variable, por lo que en un momento dado el número de datos puede ser mayor en la base de datos que la sección de variables del protocolo.
Por ejemplo, para determinar que un sujeto en particular tiene o no obesidad (la escala de medición es cualitativa dicotómica) se tiene como definición un IMC ≥ 30, entonces se requiere disponer de la medición del peso (kilogramos) y la estatura (metros). Por lo anterior, se debe registrar en la hoja o base de datos el peso, la talla y el IMC, pero en el apartado de variables del protocolo solamente se debe mencionar la obesidad, especificándose en la definición operacional la forma de clasificar a cada paciente. El caso contrario es cuando se desea conocer la modificación del peso después de una intervención para reducir la obesidad; entonces tanto en el protocolo como en la base de datos debe estar el valor obtenido en kilogramos.
Sin embargo, también puede ser una combinación. En un estudio para comprobar la efectividad de un diurético para la hipertensión arterial, a los investigadores les interesa medir tanto las modificaciones en milímetros de mercurio de las cifras de tensión arterial, como el número de pacientes que llegan a tener cifras de tensión arterial dentro de los valores normales. En este ejemplo, se tienen que incluir ambos conceptos en el apartado de variables y en la base de datos.
Recibido: 2016-05-11
Aceptado: 2016-05-30
Correspondencia: María Guadalupe Miranda-Novales. guadalumiranda@terra.com.mx
Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons