Kontent qismiga oʻtish

Histogram

Vikipediya, erkin ensiklopediya
Ushbu histogrammada balandlik teng kenglikdagi intervallarga (5 fut) bo‘lingan

Histogram — bu miqdoriy ma’lumotlarning taqsimotini vizual ko‘rsatish usuli. Histogram tuzishning birinchi qadami qiymatlar oralig‘ini "chelak"ga ajratishdir — ya’ni, barcha qiymatlar oralig‘ini bir qator intervallarga bo‘lish — va keyin har bir intervalga qancha qiymat tushganini hisoblash. Intervallar odatda bir-birini kesib o‘tmaydigan ketma-ket intervallar sifatida belgilanadi. Intervallar qo‘shni bo‘ladi va odatda teng o‘lchamda bo‘ladi[1].

Histogramlar ma’lumotlarning asosiy taqsimoti zichligini taxminiy tarzda ko‘rsatadi va ko‘pincha zichlikni baholash — ya’ni asosiy o‘zgaruvchining ehtimollik zichlik funksiyasiini baholashda ishlatiladi. Ehtimollik zichligi uchun ishlatiladigan histogramning umumiy maydoni har doim 1 ga normallashtiriladi. Agar x-o‘qidagi interval uzunliklari hammasi 1 ga teng bo‘lsa, histogram nisbiy chastota grafigi bilan bir xil bo‘ladi.

Ba’zan histogramlar ustunli grafiklar bilan chalkashib ketadi. Histogramda har bir interval turli qiymatlar oralig‘i uchun mo‘ljallangan, shuning uchun butun histogram qiymatlar taqsimotini ko‘rsatadi. Ammo ustunli grafikda har bir ustun turli kuzatuvlar kategoriyasi uchun mo‘ljallangan (masalan, har bir ustun turli populyatsiya uchun bo‘lishi mumkin), shuning uchun ustunli grafik turli kategoriyalarni solishtirishda ishlatiladi. Ba’zi mualliflar ustunli grafiklarda ustunlar orasida bo‘shliq bo‘lishini tavsiya qiladi, shunda ular histogram emasligi aniq bo‘ladi[2][3].

Bu histogramning oʻng tomonidagi maʼlumotlar, 500 ta element ishlatilgan holda:

Intervall/IntervalSoni/Frequency
−3.5 dan −2.51 gacha9
−2.5 dan −1.51 gacha32
−1.5 dan −0.51 gacha109
−0.5 dan 0.49 gacha180
0.5 dan 1.49 gacha132
1.5 dan 2.49 gacha34
2.5 dan 3.49 gacha4

Histogramdagi naqshlarni tavsiflash uchun ishlatiladigan soʻzlar: „simmetrik“, „chapga burilgan“ yoki „oʻngga burilgan“, „unimodal“, „bimodal“ yoki „multimodal“.

Maʼlumotlarni yaxshiroq tushunish uchun bir nechta turli interval kengliklaridan foydalanib, histogramni chizish tavsiya etiladi. Quyida restoran maslahatlari boʻyicha misol keltirilgan.

AQSh Aholi roʻyxati byurosi 124 million kishi uyidan tashqarida ishlashini aniqladi[4]. Ularning ishga borish vaqti boʻyicha maʼlumotlariga koʻra, quyidagi jadvalda „kamida 30 lekin 35 daqiqa dan kam boʻlmagan“ deb javob bergan odamlar soni yuqoridagi va pastdagi kategoriyalardagi sonlardan koʻproq. Bu, odatda, odamlar hisobot berishda vaqtni yaxlitlash tufayli yuzaga keladi. Maʼlumot toʻplashda qiymatlarni taxminan yaxlitlash muammosi keng tarqalgan hodisa hisoblanadi[5][6][7].

Ishga borish vaqti histogrami, AQSh 2000-yilgi aholi roʻyxati. Egri ostidagi maydon umumiy holatlar soniga teng. Ushbu diagrammada jadvaldan Q/kenglik ishlatilgan.
Absolyut sonlar boʻyicha maʼlumotlar
IntervalKenglikSoniSoni/kenglik
054180836
55136872737
105186183723
155196343926
205179813596
25571901438
305163693273
3553212642
4054122824
45159200613
60306461215
9060343557

Ushbu histogram har bir blokning balandligi orqali har bir boʻlim intervaldagi holatlar sonini koʻrsatadi, shunda har bir blokning maydoni ushbu kategoriyaga tushgan odamlar soniga teng boʻladi. Egri ostidagi maydon umumiy holatlar sonini (124 million) ifodalaydi. Ushbu turdagi histogram absolyut sonlarni koʻrsatadi, Q minglarda berilgan.

Ishga borish vaqti histogrami, AQSh 2000-yilgi aholi roʻyxati. Egri ostidagi maydon 1 ga teng. Ushbu diagrammada jadvaldan Q/umumiy/kenglik (siqilish) ishlatilgan. Blokning balandligi siqilish sifatida taʼriflanadi — yaʼni gorizontal birlik boshiga foiz.
Proportsiya boʻyicha maʼlumotlar
IntervalKenglikSoni (Q)Q/umumiy/kenglik
0541800.0067
55136870.0221
105186180.0300
155196340.0316
205179810.0290
25571900.0116
305163690.0264
35532120.0052
40541220.0066
451592000.0049
603064610.0017
906034350.0005

Ushbu histogram faqat vertikal oʻlchamda birinchi histogramdan farq qiladi. Har bir blokning maydoni ushbu kategoriya umumiy sonining ulushi sifatida ifodalanadi va barcha bloklarning umumiy maydoni 1 ga teng. Chizma koʻrsatilgan egri oddiy zichlik bahosidir. Ushbu versiya proportsiyalarni koʻrsatadi va uni „unit area histogram“ deb ham atashadi.

Boshqacha qilib aytganda, histogram klass interval kengliklari bilan ifodalangan toʻgʻri toʻrtburchaklar orqali chastota taqsimotini koʻrsatadi va bloklarning maydoni mos chastotalarga proporsional boʻladi: har bir blok balandligi intervaldagi oʻrtacha chastota zichligini ifodalaydi. Intervallar ketma-ket joylashtiriladi, shunda histogramdagi maʼlumotlar, eksklyuziv boʻlsa ham, uzluksiz ekanligi koʻrsatiladi. (Masalan, histogramda 10.5–20.5 va 20.5–33.5 oraligʻidagi ikki qoʻshni interval boʻlishi mumkin, ammo 10.5–20.5 va 22.5–32.5 oraligʻidagi ikki interval boʻlishi mumkin emas. Boʻsh intervallar boʻsh koʻrsatiladi, ularni oʻtkazib yuborish mumkin emas.)[8]

  1. Howitt, D.; Cramer, D.. Introduction to Statistics in Psychology, Fourth, Prentice Hall, 2008. ISBN 978-0-13-205161-3. 
  2. Naomi, Robbins „A Histogram is NOT a Bar Chart“. Forbes. Qaraldi: 2018-yil 31-iyul.
  3. M. Eileen Magnello (December 2006). "Karl Pearson and the Origins of Modern Statistics: An Elastician becomes a Statistician". The New Zealand Journal for the History and Philosophy of Science and Technology 1 volume. OCLC 682200824. http://www.rutherfordjournal.org/article010107.html.
  4. US 2000 census.
  5. Taylor Wilson; Safia Abdirizak (2017). "Statistical Examination of Rounding Tendencies in the Consumer Expenditure Interview Survey". JSM. pp. 894-907. https://ww2.amstat.org/meetings/proceedings/2017/data/assets/pdf/593853.pdf.
  6. Pamela Giustinelli; Charles Manski; Francesca Mollinari (2018). Tail and Center Rounding of Probabilistic Expectations in the Health and Retirement Study (working paper). NBER. doi:10.3386/w24559. https://www.nber.org/papers/w24559.
  7. Charles Manski; Francesca Mollinari. "Rounding Probabilistic Expectations in Surveys". Journal of Business & Economic Statistics 28 (2): 219-232. doi:10.1198/jbes.2009.08098.
  8. Dean, S., & Illowsky, B. (2009, February 19). Descriptive Statistics: Histogram. Retrieved from the Connexions Web site: http://cnx.org/content/m16298/1.11/