sábado, 28 de mayo de 2016

Sesión teórica tema 8: Medidas de tendencia central, posición y dispersión. Distribución normal, asimetría y curtosis.


Además de las tablas y gráficos podemos resumir una serie de observaciones mediante “estadísticos”: “Función de los datos observados”. Solo se aplican a variables cuantitativas continuas.

Hay tres grandes tipos de medidas estadísticas:

- Medidas de posición o cuantiles: dan idea de la magnitud, tamaño o posición de las observaciones de los datos una vez que están ordenados de menor a mayor.

- Medidas de tendencia central: dan idea del comportamiento central de los sujetos.

- Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de los sujetos, es decir, si son muy diferentes entre sí o no.


Medidas de tendencia central

  • Media aritmética o media: Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos los valores de la variable observada entre el total de observaciones.
La fórmula es: 

Cuando los datos están agrupados (dos intervalos), para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase: se calcula una media aritmética ponderada que se calcula sumando la marca de clase por la frecuencia absoluta, entre N.

x= Ʃmc (marca de clase)fi /n (multiplicamos la marca de clase por la frecuencia absoluta y vamos sumando, luego dividimos entre el numero de sujetos) 

  • Mediana: Es el valor de la observación tal que deja a un 50% de los datos menor y otro 50% de los datos mayor.
- Si el número de observaciones es impar el valor de la observación será justamente la observación que ocupa la posición (n+1/2) 
Ejemplo: si son 75, pues 76 entre 2 = 38, la mediana seria la edad que tiene el sujeto 38.

- Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1. 
Ejemplo: cuatro sujetos de edades, 10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos la media aritmética entre ambos.



  • Moda: Es el valor con mayor frecuencia (que más veces se repite). 
Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos modas). Se puede calcular para cualquier tipo de variable tanto la cualitativa como la cuantitativa. 

Si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud (se resta el intervalo mayor menos el menor) es mayor (hi/ci). Donde la frecuencia absoluta sea mayor.



Medidas de posición o cuantiles

Se calculan para variables cuantitativas y, al igual que la mediana, sólo tienen en cuenta la posición ordenado de mayor o menor de los valores en la muestra.

Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100 (percentiles), 10 (deciles) ó 4 partes (cuartiles), respectivamente.
  • Percentiles:
o Dividen la muestra ordenada en 100 partes.
o El percentil “i” (Pi), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i) % restante son mayores.

o Para buscar la posición de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi) sea superior al valor del percentil.

o El valor del P50 corresponde al valor de la mediana.
  • Deciles: 
o Dividen la muestra ordenada en 10 partes.

o El decil “i” (Di), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
o El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.
  • Cuartil:
o Dividen la muestra ordenada en 4 partes.

o El Q1, primer cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 25% de las observaciones son menores y que el 75% son mayores.

o El Q2, segundo cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 50% de las observaciones son menores y que el 50% son mayores. Por tanto, el Q2 coincide con el valor del D5, con el valor de la mediana P50.

o El Q3, tercer cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 75% de las observaciones son menores y que el 25% son mayores.

o El Q4, cuarto cuartil indica el valor mayor que se alcanza en la serie numérica.


A continuación, dejo un enlace para el cálculo de cuartiles, deciles y percentiles: https://www.youtube.com/watch?v=8zH1AJJdjpc 


Medidas de dispersión o variabilidad

Estas medidas la iremos viendo con el siguiente ejemplo

- Serie 1: 18,19,20,21,22.

- Mediana serie 1=20, Media serie 1=20

- Serie 2: 9,14,20,27,30.

- Mediana serie 2=20, Media serie 2=20

¿Qué es lo que diferencia a una de otra? La dispersión.

  • Rango o recorrido: 
Diferencia entre el mayor y el menor valor de la muestra.



- R1=22-18=4
- R2=30-9=21 (esto ya nos indica que la serie 2 tiene más dispersión). Hay hasta 21 años de diferencia.


  • Desviación media: Sumatorio de las diferencias de cada observación con respecto a la media

 Para datos agrupados:


Por término medio, en la serie 1, las observaciones se diferencian de la media en 1,2 años.

  • Desviación típica o estándar: Cuantifica el error que cometemos si representamos una muestra únicamente por su media. Esta es la que más se emplea debido a que esta nos da un mayor rango de error.


Para datos agrupados:



Si te quedas solo con la media de edad: en el 1º, sólo te equivocas 1,58 años, pero en el 2º te equivocas 8,74.

  • Varianza: Expresa la misma información en valores cuadráticos


Para datos agrupados:



  • Recorrido intercuartílico: 
Diferencia entre el tercer y el primer cuartil




  • Coeficiente de variación: Es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas. Se expresa sin unidades. El C.V. siempre va de 0 a 1.


C.V.1=1,58/20=0,079 

C.V.2=8,74/20=0,44   


Serie 1 = 7,9% de variabilidad.

Serie 2 = 44% de variabilidad (al ser más mayor, es más heterogéneo)



Distribuciones normales

En estadística se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. Es Distribución de probabilidad más frecuente con variables continuas.
Las distribuciones normales en un histograma aparece una especie de Campana, por eso la campana de Gauss. Y es simétrica respecto de los valores de posición central, es decir que la moda va a coincidir con la media y la mediana.


Una distribución normal sigue estos principios básicos: si al valor de la media le restamos y le sumamos una desviación típica, si la serie numérica siguiera una distribución normal (como el colesterol). Dice que el 68.25% de las observaciones se va a sumar entre los valores de la suma y la resta de la media a una desviación típica. Estas datos varían si sumamos una, dos o tres desviaciones típicas.

- S 68,26% de las observaciones.

- 2xS95,45% de las observaciones.

- 3xS 99,73% de las observaciones.



 Asimetría y Curtosis

La asimetría es al lado contrario al que vemos el pico (la moda), es decir si vemos el pico hacia la derecha la asimetría es a la izquierda, y si la moda esta a la izquierda la asimetría esta hacia la derecha.


- g1=0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media).

- g1>0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda).

- g1<0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha).



La curtosis no tiene relación con la asimetría. El Coeficiente de apuntamiento o curtosis de una variable, sirve para medir el grado de concentración de los valores que toma en torno a su media. Los datos se acumulan mucho, mientras mas se acumulen, mas apuntada esta la curva.

- g2=0 (distribución mesocúrtica o normal). Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

- g2>0 (distribución leptocúrtica). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

- g2<0 (distribución platicúrtica). Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.





miércoles, 25 de mayo de 2016

Sesión teórica tema 7: Introducción a la Bioestadística


La estadística se define como "Ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de ellos, inferencias basadas en el cálculo de probabilidades"

Parte del supuesto de que, las características clínicas que se observan cambian de un paciente a otro: variable. Por tanto, estadística es la ciencia que estudia la variabilidad, la medición de signos y síntomas.

A partir de ahora veremos temas más dinámicos, por lo que utilizaré vídeos explicativos para que sean más sencillos de comprender.

En este tema veremos las distintas escalas de medida y los tipos de variables que existen en estadística. Para ello lo haremos de forma más dinámica mediante vídeos explicativos.

En este vídeo se muestran los 4 tipos de escalas de medición existentes:


En este segundo vídeo, se explican los tipos de variables:



También veremos la representación de datos.

En este vídeo enseñaremos como funcionan las tablas de frecuencia, y se explicaran algunos conceptos como la frecuencia relativa y absoluta, mediante ejemplos explicativos:




A continuación muestro otro ejemplo de lo explicado anteriormente:


 Otras representación gráficas


  • Diagrama de barras: se utiliza para medir una variable cualitativa, nominal y sobre todo policotómicas.

  • Histograma y polígonos de frecuencia: La diferencia respecto a los anteriores es que estos son para variables continuas. 

En el eje X se representan los intervalos en los que categorizamos esa variable y en el Y la frecuencia. 


Las marcas de clase es el punto medio de cada intervalo, es decir, la media. Es la media entre los dos intervalos. (En la gráfica anterior está representada con la línea roja)

El polígono de frecuencia es el polígono que forman las marcas de clase al unirlas. 

  • Gráficos de tronco y hojas: Formas de expresar variables cuantitativas, continuas particularmente.
Ejemplo: Estudio sobre Tensión arterial sistólica en 80 pacientes adultos en mmHg.















  • Gráfico de sectores: Se utilizan para trabajar con variables cualitativas. Preferentemente para variables con pocas categorías como por ejemplo las dicotómicas.




domingo, 22 de mayo de 2016

#EnfermeríaHaceMás

Los alumnos de primero de Enfermería de la Cruz Roja queremos mandar un mensaje mostrando las múltiples labores que realizan los profesionales de Enfermería.

¡Esperamos que os guste!

miércoles, 18 de mayo de 2016

Sesión teórica tema 6: La etapa empírica de la investigación: el diseño y el material y métodos.


MATERIALES Y MÉTODOS

Población de estudio: Selección de individuos en búsqueda de validez interna y externa (evitar sesgos de selección).

Muestreo: Cuando no es posible incorporar toda la población de estudio. 
Se considerará:
·     Tamaño de la muestra: Para hacer inferencia con un erro determinado (p< 0,50 generalmente).

·   Representatividad muestreo aleatorio simple, sistemático, estratificado, por conglomerados, multietápico. El sistema que garantiza mejores condiciones de representatividad es el muestreo aleatorio simple. 




















ASIGNACIÓN DEL DISEÑO EN FUNCIÓN DE LA PREGUNTA DE INVESTIGACIÓN



















 MEDIDAS DE FRECUENCIA EN ESTUDIOS DESCRIPTIVOS

¿Qué queremos medir?:

La situación en un punto determinado en el tiempo: PREVALENCIA
·     Describe qué proporción de la población tiene la enfermedad en un punto específico en el tiempo: (diabéticos en Sevilla en marzo 2014)
·    Depende de la velocidad de aparición de la enfermedad (incidencia) y de su duración (Fumadores han dejado de fumar y no fumadores han empezado a fumar). (Si mido una enfermedad de corta duración en un momento determinado, podrá haber menos prevalencia que si mido una enfermedad de larga duración).
·          Lo que está pasando durante un periodo de tiempo: INCIDENCIA.
·         Describe la frecuencia de NUEVOS CASOS que ocurren durante un periodo de tiempo. Es el flujo de sanos a enfermos.


- Prevalencia:





Nunca puede ser inferior a cero ni superior a uno. P= 0-1.
Características:
·         Es adimensional. (no se puede medir)
·         Adopta valores entre 0 y 1 (es una proporción).


- Incidencia: 





Características:
-          Es dimensional
-          Valores entre 0 e infinito


- Incidencia acumulada: calcula una proporción de incidencia, es decir, calcula el riesgo de que se produzca un fenómeno.

Se calcula utilizando un periodo de tiempo durante el cual consideramos que todos los individuos de la población están a riesgo de la enfermedad y observamos la proporción de sujetos que desarrollan la enfermedad. Mide el riesgo promedio de padecer la enfermedad. La incidencia acumulada tiene sesgos.



-          Mide la probabilidad de tener el evento.
-          No tiene unidades. Es una proporción (se expresa como %)
-          Valores entre 0 y 1 [0-100]
-          No lleva implícito el periodo de tiempo à debe expresarse siempre.


Condiciones:

-          No puede haber perdidas en el seguimiento
-          Se siguen todos los sujetos durante todo el periodo
-          No permite inferir fuera del periodo de estudio.



 MEDIDAS DE FRECUENCIA EN ESTUDIOS DESCRIPTIVOS

Se refiere a la velocidad con la que aparecen los nuevos casos con respecto al tamaño de la población.  Con frecuencia no todos los individuos a riesgo (denominador) son seguidos durante el mismo tiempo.

·    Se mide en unidades de tiempo elevado a menos 1.
·    No son proporciones, es una tasa instantánea y puedo obtener valores por encima de 1.
·    Expresa la “tasa” a la cual ocurren los eventos en sujetos de la población en riesgo en cualquier momento.
·    Expresa velocidad: la tasa de cambio instantáneo o la rapidez con la que se desarrolla el evento en la población. 

Se calcula: 




ESTUDIOS DE SEGUIMIENTO Y EXPERIMENTALES

v  MEDIDA DE ASOCIACIÓN











v  RIESGO RELATIVO

Es la razón entre el riesgo de los expuestos y el de los no expuestos.

Cuando el riesgo relativo es 1 quiere decir que las incidencias de expuestos y no expuestos es la misma, por lo que aceptamos la hipótesis nula.
Si el resultado es menor que 1 se acepta la hipótesis nula, mientras que si es mayor que uno la despreciamos.


Seminario 3: EPI INFO 7.1.3. Estadística descriptiva.

EPI INFO

Este seminario consistió en la explicación a cerca del uso del programa EPI INFO.
Es una aplicación para la colección de datos, gestión, análisis, visualización y software de información para profesionales de salud pública. Se utiliza a nivel mundial para la investigación sanitaria, para la evaluación rápida de los brotes de enfermedades y para la formación permanente de profesionales de la salud al objeto de asegurar el aprendizaje de la ciencia de la epidemiología, las herramientas y las técnicas.

Este programa nos servirá para realizar el trabajo de investigación final, con pautas que aprenderemos en los siguientes seminarios y con las ya aprendidas. En el caso de mi grupo nuestro trabajó será, analizar la etología y la calidad de vida de pacientes con VIH/SIDA.

Para su instalación:  http://wwwn.cdc.gov/epiinfo/

A continuación adjunto un vídeo que muestra como utilizar este programa y como hacer cuestionarios:





ESTADÍSTICA DESCRIPTIVA

Además a parte de aprender a utilizar el programa para la realización de cuestionarios para nuestro trabajo final, aprendimos a utilizar la estadística descriptiva con este programa, mediante tablas, gráficas, frecuencias, medias, es decir, aplicamos la teoría aprendida en el programa.

A continuación dejaré algunos ejemplos propios de nuestro trabajo final, así como el cuestionario realizado:



 




CUESTIONARIO SOBRE LA ETIOLOGÍA DE LA TRANSMISIÓN Y LA CALIDAD DE VIDA EN PACIENTES CON VIH

Este cuestionario forma parte de un proyecto de investigación de un grupo de alumnas del primer curso del Grado de Enfermería de la Universidad de Sevilla, con ello lo que pretendemos es valorar  la etiología de la transmisión y la calidad de vida de los pacientes con VIH de la Unidad de Enfermedades Infecciosas de Hospital Virgen del Rocío de Sevilla.
Es totalmente ANÓNIMO e informativo por lo que rogamos su sinceridad.

Sexo: H__ / M__
País de origen:
Edad:
Orientación sexual: Homosexual__/ Heterosexual__/ Bisexual__

Año del diagnóstico:

Vía de transmisión

Intercambio de jeringuillas __
Transmisión vertical (madre a hijo) __
Transmisión sexual __
Transfusiones __

¿Era usted conocedor de la posibilidad de ser infectado/a por el virus del VIH cuando realizó la práctica de riesgo?
Sí __
No __

¿Pareja estable?
 Sí__ / No__


Responda según la siguiente tabla:

0
 Nunca
1
Casi nunca
2
Algunas veces
3
Bastantes veces
4
Muchas veces
5
Casi siempre
6
Siempre



¿Se sintió apoyado por sus amigos y familiares?
 __0     __1     __2     __3     __4     __5    __6
En general, ¿sintió rechazo por algunas personas?
 __0     __1     __2     __3     __4     __5    __6
¿Ha habido una disminución de sus actividades sociales?
 __0     __1     __2     __3     __4     __5    __6
¿Ha sido un impedimento en el ámbito laboral?
 __0     __1     __2     __3     __4     __5    __6
En caso de tener o haber tenido pareja estable, ¿ha sido un impedimento para él/ella?
 __0     __1     __2     __3     __4     __5    __6
A raíz del diagnóstico ¿ha sentido una bajada del estado de ánimo o depresión?
 __0     __1     __2     __3     __4     __5    __6
¿Es el tratamiento un impedimento para su vida diaria?
 __0     __1     __2     __3     __4     __5    __6
¿Ha tenido efectos secundarios producidos por el tratamiento?
__0     __1     __2     __3     __4     __5    __6
¿Ha tenido ayuda y apoyo por parte del profesional sanitario?
 __0     __1     __2     __3     __4     __5    __6
¿Cree que fue informado correctamente cuando fue diagnosticado?
 __0     __1     __2     __3     __4     __5    __6
¿Considera que hoy día la calidad de vida de los pacientes con VIH ha mejorado?
__0     __1     __2     __3     __4     __5    __6



Describa de manera resumida
¿Qué aspecto de la enfermedad le ha resultado más duro?



¿Y el más positivo?