Sıra | DOSYA ADI | Format | Bağlantı |
---|---|---|---|
01. | Istatistik | ppt | Sunumu İndir |
Transkript
istatistik Doç. Dr. Serkan HAZAR
Araştırma ve İstatistik Hakkında Ne Biliyoruz?
Konu Özeti• İstatistik Nedir? • Neden İstatistik?• İnsanlar istatistiği ne zamandır kullanıyorlar? • İstatistikte Bazı Temel Kavramlar• İstatistiksel Verileri Tasnif Etme• Korelasyon• Grafik Analizi
Herkes biraz istatistik bilmeli!
• Üniversite Oran(%)• Marmara 75• Balıkesir 85• Gazi 74•Niğde 100Herkes biraz istatistik bilmeli!Hangisi Başarılı?
Üniversite Sınava giren Kazanan Oran(%)•Marmara 60 45 75•Balıkesir 55 47 85•Gazi 62 46 74•Niğde 2 2 100Herkes biraz istatistik bilmeli!Hangisi Başarılı?
Lise Üniversiteye giren öğrenci sayısıA 120B 90C 62Herkes biraz istatistik bilmeli!Hangisi Başarılı?
Lise Üniversiteye giren öğrenci sayısıSınava giren öğrenci sayısıOran(%)B 90 210 42C 62 260 24A 120 630 19Herkes biraz istatistik bilmeli!Hangisi Başarılı?
Firma Kaza / yılA 20B 7Hangi firmanın otobüsleri daha çok kaza yapıyor?Herkes biraz istatistik bilmeli!
Firma Yolcu / gün Kaza / yıl Oran(%)A 500 20 4.0B 120 7 5.8Hangi firmanın otobüsleri daha çok kaza yapıyor?Herkes biraz istatistik bilmeli!
İstatistik Nedir?
İstatistik Nedir?• İstatistik, belirli amaçlar için veri toplama, toplanan verileri tasnif etme, çözümleme ve yorumlama bilimidir.• İstatistik sayısal verileri değerlendiren bir bilim dalı
Neden İstatistik?
Neden İstatistik?İstatistik, • Ne kadar?• Ne zaman?• Nerede?• Nasıl?• Kaç tane?• Hangi oranda?Sorularına yanıt arar
İstatistik, çevremizde olup bitenleri sayılarla ifade etmede yardımcı olur.
İnsanlar İstatistiği Ne zamandır Kullanıyorlar?• 1445 - zar atma, şans oyunları• 17.Yüzyıl ortaları, istatistik ilk kez ders kitaplarına girdi
İstatistikte Bazı Temel Kavramlar
İstatistikte Bazı Temel kavramlar• Evren– Gözlem alanına giren obje ya da bireylerin tümü• Örneklem– Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grup
İstatistikte Bazı Temel kavramlar• Değişken– Her gözleme göre farklı değerler alabilen objelere, özelliklere ya da durumlara denir• Değişkenler nicel ya da nitel olabilir.• Nitel veriler• Sayısal veriler-kesikli sayısal veriler (maç kazanma syısı)-sürekli sayısal veriler (boy, kilo)• Nitelik ve sayısal veriler arasındaki ilişki (boy sınıflandırması)
İstatistikte Bazı Temel kavramlar• Ölçme– objelere ya da bireylere belirli bir değere sahip oluş derecelerini belirtmek için sembolik değerler verme işlemidir.– Değişkenler hakkında bilgi edinmek için yapılır• Ölçüm– Ölçme sonucunda elde edilen değer
İstatistikte Bazı Temel kavramlar• Anlamlı rakamX=2.80 1 2 3 4 5 6X=5.05 cm = 5,0cm
İstatistikte Bazı Temel kavramlar• Sayıları yuvarlama5,387123 = 5,39 = 5,4 = 5
22.03.20 23Verilerin Sınıflandırılması • 2,4,4,4,6,6,8,10,12,16,18• En büyük değerden en küçük değer çıkarılarak veri aralığı tespit edilir. İstenen sınıf sayısına bölünerek• 2-18=16/8=2 veri aralığı 2 dir. • 2-4• 5-7• 8-10
22.03.20 24Frekans tablosu hazırlamaBÖLGE35 22.7 22.7 22.759 38.3 38.3 61.013 8.4 8.4 69.514 9.1 9.1 78.618 11.7 11.7 90.37 4.5 4.5 94.88 5.2 5.2 100.0154 100.0 100.0akdenizegeic anadolumarmarakaradenizdogu anadoluguneydogu anadoluTotalValidFrequency Percent Valid PercentCumulativePercent
Merkezi Eğilim Ölçüleri
İstatistikte Bazı Temel kavramlar• Aritmetik Ortalama• Aralık (range)• Sapma• Standart sapma • Ölçümlerin dağılımı ve standart sapma ile ilişkisi
İstatistikte Bazı Temel kavramlarRangeDeğişken
İstatistikte Bazı Temel kavramlard1Aritmetik ortalamaSapmad2X= değerlerin toplamı/değer sayısı
22.03.20 29Ağırlıklı ortalama• İki eşit gurubun ortalamalarının ortalamasıdır. • Geometrik ortalama
Standart sapma: • Bir dizi ölçümün gösterdiği değişimin en güvenilir ölçüsüdür.• Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür. • Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. \Kareli Ortalama Sapma\ adı da verilen bu ölçü \değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması\dır
Standart sapma: • Standart sapma /bütün elemanların ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir. [ (10-20)nin karesi + (20-20)nin karesi + (30-20)nin karesi ] / 3(yani eleman sayisi) ve yukarıdaki ifadenin karekökü.. ortalama değer
22.03.20 32Ortanca (medyan)• 50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2• Çift ise n/2 nci ile n+2/2 nci değeri /2 dir.• Veriler büyükten küçüğe doğru sıralanır ortadaki iki değerin aritmetik ortalaması alınır • 5,5,6,6,7,9,9, 7+1/2 • 5,5,6,6,7,9,9,10 8/2=4, 8+2/4=5• 6+7=13/2=6,5
22.03.20 33Tepe değer (mod) • Dağılımda en fazla tekrarlanan değerdir. • Frekansı en fazla olan sınıfın değeridir. • 5,5,6,6,6,7,9,9,10
Ölçme Sonucunun Gösterilmesi X = 5,8 ± 0,25X = 58 ± 0,2X = 58.3 ± 2Yanlış GösterimX = 58.3 ± 0.2 Doğru Gösterim
İstatistiksel Verileri Tasnif Etme
İstatistiksel Verileri Tasnif Etme• İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu:1. Sözel ifadelerle açıklama2. Tablolar halinde düzenleme3. Grafikle gösterme4. Verileri değerlendirerek istatistiksel ölçüler bulma5. Bu yöntemlerde birkaçını birlikte uygulama
İstatistiksel Verileri Tasnif EtmeVerileri sözel ifadelerle açıklama
Verileri tablolar halinde düzenleme– Frekans tablosuDenekler ağırlık( kg)1 52,52 68,03 75,84 89,7İstatistiksel Verileri Tasnif Etme
Verileri tablolar halinde düzenleme– Frekans tablosuPuan Frekans Yüzde 50-60 1 2561-70 1 2571-80 1 2581-90 1 25İstatistiksel Verileri Tasnif Etme
Verilerin grafikle gösterilmesi– Çizgi grafiği– Çubuk grafik (Histogram)– Pasta grafiğiİstatistiksel Verileri Tasnif Etme
Çizgi grafiğiİstatistiksel Verileri Tasnif EtmeFrekansPuan2468101230 40 50 60 70 80 90
Çubuk Grafikİstatistiksel Verileri Tasnif EtmeFrekansPuan34567830 40 50 60 70 80 90
Çubuk Grafikİstatistiksel Verileri Tasnif Etme05101520252000 2001 2002TÜRKÇESOSYALMATEMATİKFENÇözülen net soru sayısıYıllar
Pasta grafiğiİstatistiksel Verileri Tasnif Etme36%64%Genel lise Meslek lisesiPasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır
2003 Üniversiteye yerleşme60%19%10%11%YerleşemeyenAçık ÖğrÖnlisansLisansİstatistiksel Verileri Tasnif Etme
Doğru Grafik Seçme35%65%Genel Lise Meslek Lisesi3565050100GenelLiseMeslekLisesiAB Ülkelerinde Genel Lise Meslek Lisesi Oranlarıİkisi de olabilir. Birincisi daha uygun
Doğru Grafik Seçme4,69,48,36,5DünyaAvrupa 15'lerDoğu AvrupaTürkiye6,58,39,44,60246810DünyaAvrupa15'lerDoğuAvrupaTürkiyeÜlkelere Göre Eğitim YaşıDoğru Yanlış
Doğru Grafik SeçmeYıllara göre okul yaşı2,73,23,84,86,8024681975 1980 1985 1990 20002,73,23,84,86,819751980198519902000Doğru Yanlış
22.03.20 49ödev• Bir gurup sporcunun ağırlık değerleri aşağıda verilmiştir. • 55,56,60,65,65,67,68,70,75,77,80,82,84,86,88,90,92,95,97,100 n=20
İstatistiksel verileri açıklamada daima en etkili olanı kullanılmalıdır
Türkiye, kızların okullaşma oranında İran ve Mısır’dan da sonra geliyor69 7045020406080İran Mısır TürkiyeKızların okullaşma oranı ve Türkiye
22.03.20 52İki gurubun sınıflandırması• Sporcuların kuvvet değerleri• Erkek: 10,10,20,20,20,30,30,30,50,40• Bayan: 5,5,10,20,20,20,30,30,40,40,
22.03.20 53Veri sınıflandırması Erkek: 10,10,20,20,20,30,30,30,50,40Bayan: 5,5,10,20,20,20,30,30,40,40 Veri aralıkları BayanF %ErkekF %5-1011-1516-2021-2526-3031-3536-4041-4546-50
22.03.20 54Basit tablolaştırmaDeğişkenler N X ss min maxErkek 10 26,00 12,64 10 50Bayan 10 22,00 12,95 5 40
22.03.20 55yadaDeğişkenler N X ± SS(kg) Min (kg) Max(kg)Erkek 10 26,00 ±12,64 10 50Bayan 10 22,00 ±12,95 5 40
22.03.20 56Grafik seçeneklerikuvvet değerleri 2021222324252627erkek bayan Seri 1
NORMAL DAĞILIM NEDIR – İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. – Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. – Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir.
• Standart sapması• Frekans eğrisi çan şeklinde olan simetrik dağılımdır. • Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittirNormal dağılım,
• Dağılım şekli ölçütleri : Çarpıklık –1 ve +1 arasında yer alır. • Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık, • Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir.
Dağılım özelliğinin önemi nedir • Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. • Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir
NORMAL DAĞILIMIN KRİTERLERİ • Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. • Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir.
• Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30) kolmagorw simirnov. Yada shefi testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 ise dağılımın normal olmadığı sonucuna varılır.
• Örneklem büyüklüğü arttıkça, deneklerin dağılımı ve ortalamanın örneklem dağılımı normal dağılıma yaklaşır.• Genellikle bir örneklemde 30 ya da daha fazla sayıda denek varsa, evren normal dağılım göstermiyorsa bile, ortalamanın örneklem dağılımının normal olduğu varsayılabilir
Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :1. Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak.2. Varolan verilere parametrik olmayan bir test uygulamak
KESTİRİM• Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır
• Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır. • Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.
Hipotez testleri :• Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve Ho ile gösterilir.• H1 ile gösterilen alternatif hipotez adı verilen hipotez ise, Ho hipotezinin tam tersidir.
P değeri ve yanılma düzeyi :• Ho hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani Ho hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılır
• Parametrik ve nonparametrik testler : Istatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır. • Kategorik verilerde parametrik olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır
22.03.20 71Testler Parametrik Parametrik olmayan İki ortalama arasındaki farkın anlamlılık testi t. testMann-Witney U testi Tek yönlü varyans analizi (f testi) Kruskal-Wallis varyans analizi İki eş arasındaki farkın anlamlılık testi (t test) Wilcoxon eşleştirilmiş iki örnek testi Tekrarlı ölçümlerde varyans analizi (f testi) 4 gözlü Ki-Kare testiBağımlı örneklerde iki yüzde rasındaki farkın anlamlılk testi ( z testi) Bağımlı örneklerde ki-kare testi (McNemer testi)
22.03.20 72Bağımlı gurup- bağımsız gurup kavramı • Bağımlı gurup: bir gözlem (denek) üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur• Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur.
22.03.20 73TESTLER
22.03.20 74BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI • İki ortalama arasındaki farkın anlamlılık testi• T. Testi • Gerekli koşullar1.Karşılaştırılacak iki gurup vardır2. Guruplar birbirinden bağımsızdır3. Veriler sürekli veri gurubundadır4: evren dağılımları normal dağılım gösterir5. Evren varyansları eşitti.
22.03.20 75Mann-Witney U testi • İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır. • Parametrik koşulları sağlanmadığı durumda kullanılır
22.03.20 76Bağımsız ikiden çok gurubun karşılaştırılması • Tek yönlü varyans analizi • İkiden çok bağımsız gurup olduğunda ve parametrik koşullar sağlandığında uygulanır.• Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir.
22.03.20 77Varyans analizinde farkın kaynaklandığı gurubu belirleme • Varyans analizinde guruplar arasındaki farkın hangi gurup yada guruplardan kaynaklandığını belirlemede • 1. duncan yöntemi• Tukey HSD yöntemi• Dunnet yöntemi• Student nevman-Keuls Yöntemi kullanılır
22.03.20 78BAĞIMLI İKİ GURUBUN KARŞILAŞTIRILMASI • İKİ EŞ ARASINDAKİ FARKIN ANLAMLILIK TESTİSAYFA 149………….
Korelasyon
• Korelasyon: iki değişken arasında bağıntı olup olmadığını araştırma• Korelasyon katsayısı – r -• Regrasyon analizi: bağıntının türünü bulma Korelasyon
KorelasyonMatematik NotlarıFizik Notları
KorelasyonKişi başına gelirOrtalama ömür
Korelasyon kararı için bir-kaç veri yeter mi?Ülke nüfusuOrtalama ömür
Korelasyon kararı için bir-kaç veri yeter mi?Ülke nüfusuOrtalama ömür
Korelasyon var mı?Matematik NotlarıResim Notları
Korelasyon var mı?Frekans r*5 0,87810 0,63215 0,51420 0,44430 0,36140 0,312Korelasyon katsayısı r = 1 ise bağıntı var, r = 0 ise yok.
Grafik Analizi
• Basit korelasyon işlemlerinde kullanılır.• Grafik çizimi işlem sırası:– Eksenlerin belirlenmesi– Uygun ölçek seçimi– Verilerin yerleştirilmesi– Lineer grafik elde edilmesi– Eğim bulunması Grafik Analizi
Eksenlerin belirlenmesiSerbest değişken (birim)Bağlı değişken(birim)
Ölçek SeçimiHacimKütleHer iki ölçek uygun değil
Ölçek SeçimiHacimKütleY ölçeği uygun değil
Ölçek SeçimiX ölçeği uygun değilHacimKütle
Ölçek SeçimiHacimKütleUygun ölçek seçimi
Doğru çizimiHacimKütleDoğru çizimYanlış çizim
Doğru çizimiHacimKütleYanlış çizim Yanlış çizimDoğru çizim
Eğim BulunmasıZamanHızEğim= Hız/zaman = Tan!Dikkat!
Kaynaklar• Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme• İstatistik Yöntemler ve Uygulaması, H.Arıcı
Teşekkürler