Cómo hacer un histograma

Una de las 7 herramientas de control de calidad es el histograma. El histograma o histograma de frecuencias es un gráfico que muestra por medio de barras la distribución de frecuencias de una o más variables.

Es quizá una de las herramientas más elementales en el uso estadístico y una de las más importantes en el análisis de problemas.

Hoy, para la gestión del negocio, vamos a ver qué es y cómo se hace un histograma.

¿Qué es un histograma?

Es una herramienta usada para representar una distribución por medio de barras. La altura de la barra está en función de la frecuencia (eje y) y el rango (eje x) de una variable continua.

Nos ofrece un vistazo general del comportamiento de las variables, donde logramos analizar aspectos como distribución, dispersión, aleatoriedad y tendencia.

Tiene diferentes beneficios dependiendo del uso que se le dé. Es común que en las empresas y comunidades se usen para:

  • Tomar de decisiones con base en la representación de los datos
  • Mostrar información de interés general, por eso es común que el departamento de control de calidad los difunda.
  • Analizar rendimientos de procesos
  • Evidenciar cambios ante intervenciones (antes y después)
  • Y un largo etc. Los beneficios dependerán de la interpretación del histograma.

Generalmente el histograma se usa con variables continúas, aunque también se trabaja con variables discretas. Recordemos que variables continúas son aquellas que pueden tomar cualquier valor, es decir un número real.

Son ejemplo de variables continúas el peso, altura, masa o temperatura. Las variables discretas son aquellas que adoptan un valor entero, por ejemplo el número de personas, el número de quejas, objetos, etc.

Por otra parte, una variable cualitativa es aquella que no es numérica y muestra una cualidad del objeto de medición. Por ejemplo, la nacionalidad de una persona, los animales de una granja o el tipo de comercio en una ciudad.

¿Y por qué me dices esto?
Esto es importante mencionarlo porque es común confundir el histograma con el diagrama de barras. El mismo Wikipedia lo hace al mencionar en tipos de histogramas el diagrama de barra simple (si el artículo en Wikipedia fue editado corrigiendo este pequeño error, agradezco me notifiques)

Con un histograma analizamos la distribución de frecuencias de una o más variables (y digo variables), donde lo que se analiza no es la altura sino el área de la variable. Por eso, en un histograma las barras están juntas y no separadas. Con un diagrama de barras si analizamos la altura de la barra, las cuales están separadas. Manuel molina lo explica mucho mejor mostrando la diferencia entre un histograma y un diagrama de barras.

Cómo hacer un histograma paso a paso

Comenzamos mostrando paso a paso cómo se construye un histograma y lo conducimos a través de un ejemplo práctico.

Paso 1: ¿Cuáles son los datos que se van a analizar? ¿Los tienes? Si es así, perfecto, vamos al paso 2. Si no, procedemos a capturar los datos del fenómeno que se desea analizar.

Paso 2: Cuando hablamos de clases o intervalos nos referimos a las barras verticales que tendrá nuestro histograma. Normalmente se dice que un histograma debe tener barras del mismo ancho, lo cual no es necesariamente cierto. Dependiendo de la situación que se analiza, es más conveniente utilizar intervalos de diferente ancho.

Cuando los intervalos son del mismo ancho, la altura de cada barra será proporcional a su área. Caso contrario cuando tenemos intervalos de ancho distinto, y en este caso resulta conveniente analizar el área de la barra.

Bueno, me extendí un poco. Entonces, en el paso 2 vamos a determinar el rango. El rango se define como la resta entre el valor más grande con el valor más pequeño de tus datos capturados.

Paso 3: Existen diversas formas para definir cuántas clases considerar. K es el número de clases.

Clases según el número de datos

La primera es considerar una tabla guía. La siguiente está basada en la publicación de Roberto Behar y Pere Grima (abajo te dejo la referencia).Otras referencias sugieren 4 clases si tenemos menos de 50 datos, 7 clases para menos de 100 datos, 10 clases para menos de 150 datos, 12 clases para menos de 200 datos y 14 clases para más de 200 datos.

Número de clases raíz cuadrada
Regla de sturges

La siguiente opción es obtener la raíz cuadrada de la cantidad de datos. El resultado redondeado será el número de clases.Otra opción es la regla de Sturges. Propuesta por Hebert Sturges, nos da una regla práctica para obtener el número de clases:Hay otras formas, pero estas son las más difundidas. ¿Qué opción elegir? Como regla general considera que a mayor número de datos, más clases tendremos.

Lo realmente importante es la forma que va a tomar nuestro histograma, así que lo más recomendable es que vayas probando con cada una de las opciones buscando la que te permita hacer un mejor análisis final.

Paso 4: Determina la amplitud de clase o ancho del intervalo. Se define con la letra h. Para ello divide el rango entre el número de clases definido en el paso 3. Si obtienes un número decimal, redondea al entero más cercano. ¿Por qué? Porque la información debe ser fácil de interpretar.

Paso 5: Define las clases. Ya tienes el número de intervalos de clase a considerar y su amplitud, con esto ya puedes establecer cada clase.

Busca el número más pequeño en todos tus datos, y a ese número le vas a sumar la amplitud de clase. Ya tienes tu primer intervalo o clase.

Por ejemplo si el número más pequeño que tienes es 10 y tu amplitud de clase es 5:

Tu primer intervalo será: [10 – 15], el segundo (15, 20], y así sucesivamente.

Si te encuentras con un dato que coincide con el límite de clase, como por ejemplo «15», simplemente define un criterio para todos los intervalos de clase. Define si se ubica en el intervalo actual o el intervalo siguiente.

Por ejemplo nosotros definimos que el primer intervalo sea todos los números mayores o iguales a 10 y menores e iguales a 15. En consecuencia, el segundo intervalo será todos los números mayores a 15 y menores iguales a 20.

Paso 6: Tabula los datos con base en los intervalos de clase definidos. En otras palabras, agrupa los datos según su pertenencia a cada clase. Esto te dará la frecuencia de cada clase.

Paso 7: Construye el histograma:

  • En el eje x ubica los intervalos de clase.
  • En el eje y ubica la frecuencia.

Según la amplitud del intervalo, será el ancho de la barra. El paso a paso que venimos tratando es para intervalos de clase del mismo ancho.

Paso 8: Interpreta el histograma. Analiza aspectos como la tendencia, la variabilidad y la forma de distribución de los datos.

Ejemplo de histograma

Vamos a considerar que, una empresa de búsqueda de empleo ha decidido hacer un estudio del tiempo que se demoran sus asesores con cada usuario.

Paso 1: Para este estudio, se tomó el tiempo en minutos de asesoramiento con 50 usuarios.

Tiempos tomados para elaborar histograma

Paso 2: Determinamos el rango. El valor más grande es 15,5 y el más pequeño es 8,2.

15,5 – 8,2 = 7,3

raíz cuadrada ejemplo histograma

Paso 3: Calculamos el número de intervalos de clase (K). Lo hacemos con la fórmula de raíz cuadrada del número de datos.K=7,07

Lo redondeamos al entero más cercano: 7

Paso 4: Calculamos la amplitud o ancho del intervalo. Es la división del rango (paso 2) entre el número de intervalos (paso 3).

7.3 / 7 = 1.04

El resultado es: 1,04. Bien podemos redondearlo a 1 o mantenernos en 1,04. Como el ejemplo lo estoy elaborando con la plantilla de histograma en excel, lo dejaré en 1,04.

Paso 5 y 6:

Definimos las clases sumándole al valor más pequeño, el ancho del intervalo hasta que obtenga 7 intervalos de clase, justo allí deberá estar el valor más grande de mis datos. A continuación, agrupamos cada valor dentro del intervalo de clase, o dicho de otra forma, determinamos la frecuencia. El resultado es el siguiente:

Intervalos de clase en ejemplo de histograma

Paso 7: Construimos el histograma.

Personalmente prefiero ubicar en el eje x la marca de clase y no los intervalos de clase. La marca de clase es el resultado de sumar el límite superior e inferior del intervalo y dividirlos por dos. El resultado no afecta la forma del histograma.

Además, me gusta junto al histograma trazar el polígono de frecuencias, que no es más que conectar con rectas la parte superior de cada columna, justo en la mitad. Esto da una mejor idea de la forma de distribución del histograma.

El resultado del ejercicio resuelto del histograma es el siguiente:

ejemplo de histograma con marcas de clase
Ejemplo de histograma con marcas de clase

Lo anterior, es para un histograma que tiene sus columnas del mismo ancho. ¿Cómo se trabaja un histograma con ancho de columna variable?

Ejemplo de histograma con ancho de columna variable

Pensemos en que el agua es un elemento indispensable para la producción de una curtiembre, así mismo la decisión de cuánta agua usar es determinante en el acabado del cuero que se consigue.

Una empresa está definiendo la cantidad idónea de agua a usar en su proceso, para lo cual realiza diversos experimentos en los que recolecta datos asociados a la cantidad de agua usada y la conformidad en el acabado de los cueros terminados.

Primero: Definimos las categorías o intervalos.

Algunos autores y estudiosos han establecido métodos para definir el ancho variable de las columnas de un histograma. No es el objetivo de este post mostrar estos métodos. En nuestro ejercicio resuelto, el departamento de control de calidad ha decidido definirlo de la siguiente forma:

  • Mayores de 0 a 1,5 L
  • Mayores de 1,5 a 3.0 L
  • Mayores de 3.0 a 4,5 L
  • Mayores de 4.5 a 5.0 L
  • Mayores de 5.1 a 7.0 L

Segundo: Como la empresa no cuenta con datos, es necesario hacer las pruebas y tomar los resultados.

Tercero: Los datos tabulados son los siguientes:

Número de cueros por intervalo
Número de cueros por intervalo

Cuarto: Vamos a trazar el histograma.

Excel, hasta donde conozco, ni en su última versión (2016) incorpora herramientas para elaborar histogramas con columnas de ancho variable, razón por la cual te presento el histograma hecho en paint 🙂 Lo hice lo mejor que pude.

Ejemplo resuelto de histograma
Ejemplo de histograma con ancho de columna variable

Fíjate que el rango 3,01 – 4,5 es el que tiene el mayor número de cueros terminados en buen estado. En el ejercicio resuelto consideré intervalos variables únicamente para ilustrar un ejemplo diferente de los que se suelen ver en fuentes digitales y físicas.

Plantilla en excel histograma

La siguiente plantilla en excel te permitirá elaborar un histograma con barras del mismo ancho, únicamente digita los datos.

¿Quieres automatizar tu trabajo?
Todos queremos hacer más rápido nuestro trabajo. Encuentra en la sección de plantillas en excel archivos para automatizar o acelerar tus tareas, incluyendo nuestra plantilla de histograma. Con ella podrás elaborar histogramas con barras del mismo ancho solo digitando los datos.

Fuentes consultadas

Las siguientes fuentes te servirán para complementar, si lo consideras necesario, la información de este post:


Derechos de imagen

La imagen destacada del post es: Designed by Freepik

Cómo referenciar este artículo

APACHICAGOICONTECISO 690MLA

Betancourt, D. F. (29 de julio de 2016). Cómo hacer un histograma. Recuperado el 01 de febrero de 2025, de Ingenio Empresa: www.ingenioempresa.com/histograma.

Betancourt, Diego Fernando. Cómo hacer un histograma. (29 de julio de 2016). www.ingenioempresa.com/histograma. (último acceso: 01 de febrero de 2025).

BETANCOURT, Diego. Cómo hacer un histograma. [En línea]. 29 de julio de 2016. [Citado 01 de febrero de 2025]. Disponible en: (www.ingenioempresa.com/histograma).

BETANCOURT QUINTERO, Diego. Cómo hacer un histograma. En: Ingenio Empresa. [En línea]. 29 de julio de 2016. [Citado el: 01 de febrero de 2025]. www.ingenioempresa.com/histograma.

Betancourt, Diego Fernando. Cómo hacer un histograma. 29 de julio de 2016. 01 de febrero de 2025. <www.ingenioempresa.com/histograma>.

35 comentarios en «Cómo hacer un histograma»

  1. Gracias por compartir tus conocimientos de forma clara y sencilla. Este es un post para los que no entienden nada de lo que es un histograma, desgraciadamente existen personas que todo lo quieren peladito y en la boca, Es necesario investigar por nuestra cuenta para aumentar nuestros conocimientos y si lo que queremos es que resuelvan nuestros problemas escolares con mayor dificultas pues este no es el sitio, para eso existen los libros y hay que tener el hábito de la lectura.
    gracias nuevamente porque si es de mucha valía tus aportes.

    Responder
  2. Hola, muy buena información, me ha ayudado mucho, muchas gracias.
    Pero, si en vez de: que primer intervalo quede: [10 – 15] y el segundo (15, 20], y así sucesivamente.
    Necesito que quede: primer intervalo será: [10 – 15), el segundo [15, 20), tercer [20, 25) y así sucesivamente hasta que el ultimo quede [35, 40].
    Gracias de antemano.

    Responder
  3. Agradeciendo primeramente tu aporte, por ser muy útil; solo quería hacer unos aportes a tu investigación: A mi opinión el ejemplo puede mejorar cambiando el concepto del problema, ya que se toma como numero de muestras al «tiempo por usuario», el tiempo va solo hasta 60, ya que en las datos a analizar hay datos como: 11.70… no existe el tiempo de 11.70 en minutos, solo se puede hasta 11.59 espero me deje explicar; por ejemplo yo use como concepto «pago para cada asesor» y así ya no abría necesidad de cambiar los datos, solo el concepto; y por ultimo agregar un factor de corrección (D), el cual permite disminuir el error sobre todo si el histograma se aplica al tema de calidad.

    Responder
  4. Veo (según algunas fechas en las comentarios) que este post ya lleva al menos 3 años publicado, y aún así sigue llegando gente, y sobre todo, que el autor del artículo sigue respondiendo a los comentarios.
    Por eso le doy mis felicitaciones, no solo por el contenido, el cual me fue de gran ayuda pues esta muy bien explicado y además se nota el trabajo puesto en él, sino también por la atención que el autor muestra con sus visitantes-lectores. Gracias Diego por esforzarte.

    Responder
    • Gracias por mencionarlo Hadith. A veces no me da el tiempo o escriben preguntas muy específicas de un tema que escribí ya hace tiempo y no recuerdo bien, y por tiempo es díficil de contestar, pero siempre hacemos el esfuerzo.

      Saludos.

      Responder
    • Hola Luis. El histograma te da una visión gráfica del comportamiento de los datos a nivel de distribución, dispersión, aleatoriedad y tendencia. La conclusión se obtiene a partir del análisis de uno o más de estos factores dentro del gráfico, el cual, si es pertinente dado el comportamiento de los datos, te encamia a tomar decisiones.

      En el segundo ejemplo del post, -el de las curtiembres- el análisis nos dice que el rango 3,01 – 4,5 es el que tiene el mayor número de cueros terminados en buen estado. La conclusión es que ahora debemos hacer el mismo análisis dentro de escalas más ajustadas dentro de este rango, esto para aumentar la cantidad de cueros conformes dada la cantidad de agua.

      Me cuentas, un saludo.

      Responder
  5. Pésimo, se extiende demasiado, tanto así que el “como hacer un histograma” del titulo se puede resumir solamente en el paso 7 y ni siquiera explica para intervalos de distinto ancho.

    Responder
    • La extensión del artículo está pensada para que cualquier persona con dudas o sin conocimientos en el tema, pueda elaborar un histograma y comprender los conceptos relacionados. Mi estimado, si me hablas de dibujar un histograma, en efecto basta con el paso 7 y este no es el post para ti.

      Responder
    • Para entender bien un tema es necesario extenderlo, ya que así se puede explicar mejor cada parte del tema; ademas, está dentro de tu capacidad buscar mas información, acerca de los intervalos de distinto ancho, que no es necesario porque el post lo explica. saludos.

      Responder
    • Hola Jairo.

      Son diferentes expresiones de la formula de Sturges. La que está en el post es un logaritmo de base 10 donde N es la cantidad de datos. Si buscas más allá de wikipedia, te encontrarás con que esta es la expresión mas difundida.
      Wikipedia lo expresa a través de M siendo este el tamaño de la muestra.

      Responder

Deja un comentario

Responsable de tus datos: Diego Betancourt. Finalidad: Moderación de los comentarios por el tiempo que dure este post publicado o hasta que decidas borrar tu comentario. Legitimación: Tu consentimiento otorgado en este formulario. Destinatario: Wordpress.Derechos: Tienes derechos de acceso, rectificación, cancelación y oposición de tus datos. Este sitio usa Akismet para reducir el spam. Conoce cómo se procesan los datos de tus comentarios.

Ingenio Empresa