Innehållsförteckning:

Vad är extremvärden i dataanalys?
Vad är extremvärden i dataanalys?

Video: Vad är extremvärden i dataanalys?

Video: Vad är extremvärden i dataanalys?
Video: Extrempunkter och Extremvärden 2024, Maj
Anonim

I statistiken, en uteliggare är en data punkt som skiljer sig väsentligt från andra observationer. Ett uteliggare kan bero på variabilitet i mätningen eller det kan indikera experimentellt fel; de senare är ibland uteslutna från data uppsättning. Ett uteliggare kan orsaka allvarliga problem i Statistiska analyser.

Med tanke på detta, hur hittar du extremvärden i data?

En punkt som faller utanför data setets innerfences klassificeras som minderårig uteliggare , medan en som faller utanför de yttre stängslen klassas som en major uteliggare . För att hitta de inre staketen för din data ställ först, multiplicera interkvartilområdet med 1,5. Lägg sedan till resultatet till Q3 och subtrahera det från Q1.

Bortsett från ovan, ska jag ta bort extremvärden från mina data? För de det mesta, om din data påverkas av dessa extrema fall, du burk bunden de input till en historisk representant för din data som exkluderar extremvärden . Bestäm från fall till fall vad de effekten av extremvärdena var. Och därifrån bestämmer du dig för om du vill avlägsna , ändra eller behålla den avvikande värden.

Med avseende på detta, hur hanterar dataanalys extremvärden?

Här är fyra tillvägagångssätt:

  1. Släpp extremposterna. När det gäller Bill Gates, eller en annan sann avvikare, är det ibland bäst att helt ta bort den posten från din datauppsättning för att förhindra att den personen eller händelsen förvränger din analys.
  2. Begränsa dina extremdata.
  3. Tilldela ett nytt värde.
  4. Prova en förvandling.

Vad är ett exempel på en extremvärde?

Uteliggare . mer Ett värde som "ligger utanför" (som är mycket mindre eller större än) de flesta andra värden i en datauppsättning. För exempel i poängen 25, 29, 3, 32, 85, 33, 27, 28 är både3 och 85 " extremvärden ".

Rekommenderad: