Histogram

Histogram — bu miqdoriy ma’lumotlarning taqsimotini vizual ko‘rsatish usuli. Histogram tuzishning birinchi qadami qiymatlar oralig‘ini "chelak"ga ajratishdir — ya’ni, barcha qiymatlar oralig‘ini bir qator intervallarga bo‘lish — va keyin har bir intervalga qancha qiymat tushganini hisoblash. Intervallar odatda bir-birini kesib o‘tmaydigan ketma-ket intervallar sifatida belgilanadi. Intervallar qo‘shni bo‘ladi va odatda teng o‘lchamda bo‘ladi[1].
Histogramlar ma’lumotlarning asosiy taqsimoti zichligini taxminiy tarzda ko‘rsatadi va ko‘pincha zichlikni baholash — ya’ni asosiy o‘zgaruvchining ehtimollik zichlik funksiyasiini baholashda ishlatiladi. Ehtimollik zichligi uchun ishlatiladigan histogramning umumiy maydoni har doim 1 ga normallashtiriladi. Agar x-o‘qidagi interval uzunliklari hammasi 1 ga teng bo‘lsa, histogram nisbiy chastota grafigi bilan bir xil bo‘ladi.
Ba’zan histogramlar ustunli grafiklar bilan chalkashib ketadi. Histogramda har bir interval turli qiymatlar oralig‘i uchun mo‘ljallangan, shuning uchun butun histogram qiymatlar taqsimotini ko‘rsatadi. Ammo ustunli grafikda har bir ustun turli kuzatuvlar kategoriyasi uchun mo‘ljallangan (masalan, har bir ustun turli populyatsiya uchun bo‘lishi mumkin), shuning uchun ustunli grafik turli kategoriyalarni solishtirishda ishlatiladi. Ba’zi mualliflar ustunli grafiklarda ustunlar orasida bo‘shliq bo‘lishini tavsiya qiladi, shunda ular histogram emasligi aniq bo‘ladi[2][3].
Misollar
[tahrir | manbasini tahrirlash]Bu histogramning oʻng tomonidagi maʼlumotlar, 500 ta element ishlatilgan holda:

| Intervall/Interval | Soni/Frequency |
|---|---|
| −3.5 dan −2.51 gacha | 9 |
| −2.5 dan −1.51 gacha | 32 |
| −1.5 dan −0.51 gacha | 109 |
| −0.5 dan 0.49 gacha | 180 |
| 0.5 dan 1.49 gacha | 132 |
| 1.5 dan 2.49 gacha | 34 |
| 2.5 dan 3.49 gacha | 4 |
Histogramdagi naqshlarni tavsiflash uchun ishlatiladigan soʻzlar: „simmetrik“, „chapga burilgan“ yoki „oʻngga burilgan“, „unimodal“, „bimodal“ yoki „multimodal“.
- Simmetrik, unimodal
- O‘ngga burilgan
- Chapga burilgan
- Bimodal
- Multimodal
- Simmetrik
Maʼlumotlarni yaxshiroq tushunish uchun bir nechta turli interval kengliklaridan foydalanib, histogramni chizish tavsiya etiladi. Quyida restoran maslahatlari boʻyicha misol keltirilgan.
- Maslahatlar, 1$ interval kengligi bilan, o‘ngga burilgan, unimodal
- Maslahatlar, 10 sent interval kengligi bilan, hali ham o‘ngga burilgan, multimodal, modalar $ va 50 sentda, yaxlitlashni ko‘rsatadi, shuningdek, ayrim chet qiymatlar
AQSh Aholi roʻyxati byurosi 124 million kishi uyidan tashqarida ishlashini aniqladi[4]. Ularning ishga borish vaqti boʻyicha maʼlumotlariga koʻra, quyidagi jadvalda „kamida 30 lekin 35 daqiqa dan kam boʻlmagan“ deb javob bergan odamlar soni yuqoridagi va pastdagi kategoriyalardagi sonlardan koʻproq. Bu, odatda, odamlar hisobot berishda vaqtni yaxlitlash tufayli yuzaga keladi. Maʼlumot toʻplashda qiymatlarni taxminan yaxlitlash muammosi keng tarqalgan hodisa hisoblanadi[5][6][7].

Absolyut sonlar boʻyicha maʼlumotlar Interval Kenglik Soni Soni/kenglik 0 5 4180 836 5 5 13687 2737 10 5 18618 3723 15 5 19634 3926 20 5 17981 3596 25 5 7190 1438 30 5 16369 3273 35 5 3212 642 40 5 4122 824 45 15 9200 613 60 30 6461 215 90 60 3435 57
Ushbu histogram har bir blokning balandligi orqali har bir boʻlim intervaldagi holatlar sonini koʻrsatadi, shunda har bir blokning maydoni ushbu kategoriyaga tushgan odamlar soniga teng boʻladi. Egri ostidagi maydon umumiy holatlar sonini (124 million) ifodalaydi. Ushbu turdagi histogram absolyut sonlarni koʻrsatadi, Q minglarda berilgan.

Proportsiya boʻyicha maʼlumotlar Interval Kenglik Soni (Q) Q/umumiy/kenglik 0 5 4180 0.0067 5 5 13687 0.0221 10 5 18618 0.0300 15 5 19634 0.0316 20 5 17981 0.0290 25 5 7190 0.0116 30 5 16369 0.0264 35 5 3212 0.0052 40 5 4122 0.0066 45 15 9200 0.0049 60 30 6461 0.0017 90 60 3435 0.0005
Ushbu histogram faqat vertikal oʻlchamda birinchi histogramdan farq qiladi. Har bir blokning maydoni ushbu kategoriya umumiy sonining ulushi sifatida ifodalanadi va barcha bloklarning umumiy maydoni 1 ga teng. Chizma koʻrsatilgan egri oddiy zichlik bahosidir. Ushbu versiya proportsiyalarni koʻrsatadi va uni „unit area histogram“ deb ham atashadi.
Boshqacha qilib aytganda, histogram klass interval kengliklari bilan ifodalangan toʻgʻri toʻrtburchaklar orqali chastota taqsimotini koʻrsatadi va bloklarning maydoni mos chastotalarga proporsional boʻladi: har bir blok balandligi intervaldagi oʻrtacha chastota zichligini ifodalaydi. Intervallar ketma-ket joylashtiriladi, shunda histogramdagi maʼlumotlar, eksklyuziv boʻlsa ham, uzluksiz ekanligi koʻrsatiladi. (Masalan, histogramda 10.5–20.5 va 20.5–33.5 oraligʻidagi ikki qoʻshni interval boʻlishi mumkin, ammo 10.5–20.5 va 22.5–32.5 oraligʻidagi ikki interval boʻlishi mumkin emas. Boʻsh intervallar boʻsh koʻrsatiladi, ularni oʻtkazib yuborish mumkin emas.)[8]
Manbalar
[tahrir | manbasini tahrirlash]- ↑ Howitt, D.; Cramer, D.. Introduction to Statistics in Psychology, Fourth, Prentice Hall, 2008. ISBN 978-0-13-205161-3.
- ↑ Naomi, Robbins „A Histogram is NOT a Bar Chart“. Forbes. Qaraldi: 2018-yil 31-iyul.
- ↑ M. Eileen Magnello (December 2006). "Karl Pearson and the Origins of Modern Statistics: An Elastician becomes a Statistician". The New Zealand Journal for the History and Philosophy of Science and Technology 1 volume. OCLC 682200824. http://www.rutherfordjournal.org/article010107.html.
- ↑ US 2000 census.
- ↑ Taylor Wilson; Safia Abdirizak (2017). "Statistical Examination of Rounding Tendencies in the Consumer Expenditure Interview Survey". JSM. pp. 894-907. https://ww2.amstat.org/meetings/proceedings/2017/data/assets/pdf/593853.pdf.
- ↑ Pamela Giustinelli; Charles Manski; Francesca Mollinari (2018). Tail and Center Rounding of Probabilistic Expectations in the Health and Retirement Study (working paper). NBER. doi:10.3386/w24559. https://www.nber.org/papers/w24559.
- ↑ Charles Manski; Francesca Mollinari. "Rounding Probabilistic Expectations in Surveys". Journal of Business & Economic Statistics 28 (2): 219-232. doi:10.1198/jbes.2009.08098.
- ↑ Dean, S., & Illowsky, B. (2009, February 19). Descriptive Statistics: Histogram. Retrieved from the Connexions Web site: http://cnx.org/content/m16298/1.11/