Excel för statistisk dataanalys Detta är en webbtextkompanys webbplats för företagsstatistik USA Site Omfattande besök på webbplatsen, där du kan läsa mer om den här sidan: Plats och plats för Amrica Latina Plats för E. E.U. U. Excel är det mycket använda statistiska paketet, som fungerar som ett verktyg för att förstå statistiska begrepp och beräkning för att kontrollera din handarbetade beräkning för att lösa dina läxor. Webbplatsen ger en introduktion för att förstå grunderna i och arbetet med Excel. Genom att rätta till de illustrerade numeriska exemplen på denna sida kommer du att förbättra din förtrogenhet och därigenom öka effektiviteten och effektiviteten i din process i statistiken. Att söka på webbplatsen. försök E dit F in på sidan Ctrl f. Ange ett ord eller en fras i dialogrutan, t. ex. quot variancequot eller quot averagequot Om det första uttrycket av ordfrasen inte är det du letar efter, försök F in Next. Introduktion Denna webbplats ger illustrativ erfarenhet av användningen av Excel för datasammanfattning, presentation och för annan grundläggande statistisk analys. Jag tror att den populära användningen av Excel ligger på de områden där Excel verkligen kan utmärka sig. Detta inkluderar organiseringsdata, dvs grundläggande datahantering, tabulering och grafik. För riktiga statistiska analyser måste man lära sig med professionella kommersiella statistikpaket som SAS och SPSS. Microsoft Excel 2000 (version 9) tillhandahåller en uppsättning dataanalysverktyg som heter Analysverktygspaketet som du kan använda för att spara steg när du utvecklar komplexa statistiska analyser. Du anger data och parametrar för varje analys, verktyget använder lämpliga statistiska makrofunktioner och visar sedan resultaten i ett utmatningsbord. Vissa verktyg genererar diagram i tillägg till utmatningstabeller. Om kommandot Data Analys kan väljas på Verktyg-menyn, är Analysis ToolPak installerat på ditt system. Om kommandot Data Analys inte finns på Verktyg-menyn måste du installera Analysis ToolPak genom att göra följande: Steg 1: Klicka på Add-Ins på Verktyg-menyn. Om Analysverktygspaket inte är listat i dialogrutan Add-ins, klicka på Bläddra och leta reda på enhet, mappnamn och filnamn för Analysverktygspak-tillägget Analys32.xll som vanligtvis finns i mappen Program FilesMicrosoft OfficeOfficeLibraryAnalysis. När du väl har hittat filen, markera den och klicka på OK. Steg 2: Om du inte hittar filen Analys32.xll måste du installera den. Sätt in din Microsoft Office 2000-skiva 1 i cd-rom-enheten. Välj Kör från Windows Start-menyn. Bläddra och välj köra för din cd. Välj Setup. exe, klicka på Öppna och klicka på OK. Klicka på knappen Lägg till eller ta bort funktioner. Klicka på nästa till Microsoft Excel för Windows. Klicka på nästa till tillägg. Klicka på nedpilen bredvid Analysis ToolPak. Välj Kör från den här datorn. Välj knappen Uppdatera nu. Excel kommer nu att uppdatera ditt system för att inkludera Analysis ToolPak. Starta Excel. Klicka på Add-Ins på Verktyg-menyn. - och välj kryssrutan Analysverktygspaket. Steg 3: Analysis ToolPak Add-In är nu installerat och Data Analysis. kommer nu att väljas på Verktyg-menyn. Microsoft Excel är ett kraftfullt kalkylarkspaket tillgängligt för Microsoft Windows och Apple Macintosh. Kalkylbladsprogrammet används för att lagra information i kolumner och rader som sedan kan organiseras och behandlas. Kalkylark är utformade för att fungera bra med siffror men innehåller ofta text. Excel organiserar ditt arbete i arbetsböcker varje arbetsbok kan innehålla många kalkylblad kalkylblad används för att lista och analysera data. Excel är tillgängligt på alla offentligt åtkomst-datorer (dvs. de, t ex i biblioteket och PC Labs). Den kan öppnas antingen genom att välja Start - Program - Microsoft Excel eller genom att klicka på Excel Short Cut som finns antingen på skrivbordet eller på någon dator eller på verktygsfältet Office. Öppna ett dokument: Klicka på File-Open (CtrlO) för att öppna en befintlig arbetsbok ändra mappområdet eller kör för att leta efter filer på andra platser För att skapa en ny arbetsbok klickar du på File-New-Blank Document. Spara och stänga ett dokument: För att spara ditt dokument med dess nuvarande filnamn, plats och filformat, klicka antingen på Arkiv - Spara. Om du sparar för första gången klickar du på Arkiv Spara Spara-typ ett namn på ditt dokument och klickar sedan på OK. Använd också File-Save om du vill spara till en annan filamellokalisering. När du är färdig med att arbeta på ett dokument ska du stänga det. Gå till Arkiv-menyn och klicka på Stäng. Om du har gjort några ändringar sedan filen sparades sparas du om du vill spara dem. Excel-skärmen Arbetsböcker och kalkylblad: När du startar Excel visas ett tomt kalkylblad som består av ett flertal rutor av celler med numrerade rader nerför sidan och kolumner i alfabetisk rubrik över sidan. Varje cell refereras av dess koordinater (t ex A3 används för att referera till cellen i kolumn A och rad 3 B10: B20 används för att referera till cellintervallet i kolumn B och raderna 10 till 20). Ditt arbete lagras i en Excel-fil som heter en arbetsbok. Varje arbetsbok kan innehålla flera kalkylblad och diagram - det aktuella kalkylbladet heter det aktiva arket. Om du vill visa ett annat kalkylblad i en arbetsbok klickar du på lämplig arkflik. Du kan komma åt och exekvera kommandon direkt från huvudmenyn eller du kan peka på en av verktygsfältets knappar (displayrutan som visas under knappen, när du placerar markören över den, anger namnet på knappen) och klickar en gång. Flytta runt kalkylbladet: Det är viktigt att kunna flytta runt kalkylbladet effektivt eftersom du bara kan skriva in eller ändra data vid markörens position. Du kan flytta markören med hjälp av piltangenterna eller genom att flytta musen till önskad cell och klicka. När väl vald cell blir den aktiva cellen och identifieras med en tjock gräns kan endast en cell vara aktiv i taget. För att flytta från ett kalkylblad till ett annat klickar du på flikarna. (Om din arbetsbok innehåller många ark, högerklicka på flikrutningsknapparna och klicka sedan på det ark du vill ha.) Namnet på det aktiva arket visas med fetstil. Flytta mellan celler: Här är en snabbtangent för att flytta den aktiva cellen: Hem - flyttas till den första kolumnen i den aktuella raden CtrlHome - flyttas till det övre vänstra hörnet av dokumentet Sluta sedan Hem - flyttas till den sista cellen i dokumentet Till flytta mellan celler på ett kalkylblad, klicka på någon cell eller använd piltangenterna. Om du vill se ett annat område i arket använder du rullningsfälten och klickar på pilarna eller området ovanför rullningslådan i antingen vertikala eller horisontella rullningsfält. Observera att storleken på en bläddringsruta anger proportionell mängd av det använda området på det ark som syns i fönstret. Positionen för en rullningsruta indikerar det synliga områdets relativa plats inom arbetsbladet. Ange data Ett nytt arbetsblad är ett rutnät med rader och kolumner. Raderna är märkta med siffror, och kolumnerna är märkta med bokstäver. Varje korsning av en rad och en kolumn är en cell. Varje cell har en adress. vilken är kolumnbokstaven och radnumret. Pilen på kalkylbladet till höger pekar på cell A1, som för närvarande är markerad. vilket indikerar att det är en aktiv cell. En cell måste vara aktiv för att ange information i den. För att markera (välj) en cell, klicka på den. För att välja mer än en cell: Klicka på en cell (t. ex. A1) och håll sedan växlingsnyckeln medan du klickar på en annan (t. ex. D4) för att välja alla celler mellan och inklusive A1 och D4. Klicka på en cell (t. ex. A1) och dra musen över det önskade området, klicka inte på en annan cell (t. ex. D4) för att välja alla celler mellan och inklusive A1 och D4. För att välja flera celler som inte är intill, tryck på kontrollen och klicka på de celler du vill välja. Klicka på ett nummer eller bokstavsmärkning en rad eller kolumn för att välja den hela raden eller kolumnen. Ett kalkylblad kan ha upp till 256 kolumner och 65 536 rader, så det tar ett tag innan du går tom för rymden. Varje cell kan innehålla en etikett. värde. logiskt värde. eller formel. Etiketter kan innehålla en kombination av bokstäver, siffror eller symboler. Värden är siffror. Endast värden (siffror) kan användas i beräkningarna. Ett värde kan också vara ett datum eller en tidLogiska värden är sanna eller falska. Formuler gör automatiskt beräkningar på värdena i andra specificerade celler och visar resultatet i cellen där formeln anges (till exempel kan du ange den cellen D3 är att innehålla summan av siffrorna i B3 och C3 kommer numret som visas i D3 att vara en funktion av numren som matas in i B3 och C3). Om du vill ange information i en cell markerar du cellen och börjar skriva. Observera att när du skriver information i cellen visas informationen du anger också i formulärfältet. Du kan också ange information i formulärfältet och informationen kommer att visas i den valda cellen. När du har skrivit in etiketten eller värdet: Tryck på Enter för att flytta till nästa cell nedan (i det här fallet A2) Tryck på Tab för att flytta till nästa cell till höger (i det här fallet B1) Klicka i vilken cell som helst för att välja Det skriver in etiketter Om inte informationen du anger är formaterad som ett värde eller en formel, tolkar Excel det som en etikett och standardinställer texten på vänster sida av cellen. Om du skapar ett långt arbetsblad och du kommer att upprepa samma etikettinformation i många olika celler kan du använda funktionen AutoComplete. Den här funktionen kommer att se på andra poster i samma kolumn och försöka matcha en tidigare post med din aktuella post. Om du till exempel har skrivit Wesleyan i en annan cell och skriver W i en ny cell, kommer Excel automatiskt att skriva in Wesleyan. Om du tänkte skriva Wesleyan i cellen, är din uppgift klar, och du kan gå vidare till nästa cell. Om du tänkte skriva något annat, t. ex. Williams, in i cellen, fortsätt bara att skriva för att skriva in termen. För att aktivera funktionen AutoComplete, klicka på Verktyg i menyraden, välj sedan Alternativ, välj sedan Redigera och klicka för att markera kryssrutan bredvid Aktivera AutoComplete för cellvärden. Ett annat sätt att snabbt ange upprepade etiketter är att använda Pick List-funktionen. Högerklicka på en cell och välj sedan Välj från lista. Detta ger dig en meny med alla andra poster i celler i den kolumnen. Klicka på ett objekt i menyn för att mata in det till den aktuella valda cellen. Ett värde är ett nummer, datum eller tid, plus några symboler om det behövs för att ytterligare definiera numren 91such som. - () 93. Antal antas vara positiva för att ange ett negativt tal, använda ett minustecken - eller bifoga numret inom parentes (). Datum sparas som MMDDYYYY, men du behöver inte ange det exakt i det formatet. Om du går in den 9 januari eller 9 januari kommer Excel att känna igen den den 9 januari i det aktuella året och lagra den som 192002. Ange det fyrsiffriga året för ett annat år än det aktuella året (t. ex. 9 jan 1999). För att ange dagens datum, tryck på kontrollen och samtidigt. Tider som standard till en 24-timmars klocka. Använd a eller p för att ange am eller pm om du använder en 12 timmars klocka (t ex 8:30 p tolkas som 8:30 PM). För att ange aktuell tid trycker du på kontroll och: (skift-semikolon) samtidigt. En post som tolkas som ett värde (nummer, datum eller tid) är inriktad mot cellens högra sida, för att omforma ett värde. Avrunda nummer som uppfyller specificerade kriterier: Att tillämpa färger till högsta och / eller minsta värden: Välj en cell i regionen och tryck CtrlShift (i Excel 2003, tryck på detta eller CtrlA) för att välja aktuell region. På menyn Format väljer du Villkorlig formatering. I villkor 1 väljer du Formel Is och skriver MAX (F: F) F1. Klicka på Format, välj fliken Teckensnitt, välj en färg och klicka sedan på OK. I villkor 2, välj Formel Is och skriv MIN (F: F) F1. Upprepa steg 4, välj en annan färg än du valde för tillstånd 1 och klicka sedan på OK. Obs! Var noga med att skilja mellan absolut referens och relativ referens när du anger formlerna. Rundnummer som uppfyller specificerade kriterier Problem: Avrunda alla siffror i kolumn A till noll decimaler, förutom de som har 5 i första decimalen. Lösning: Använd IF, MOD och ROUND-funktionerna i följande formel: IF (MOD (A2,1) 0,5, A2, ROUND (A2,0)) Att kopiera och klistra in alla celler i ett ark Välj cellerna i arket genom att trycka på CtrlA (i Excel 2003, välj en cell i ett tomt område innan du trycker på CtrlA eller från en vald cell i ett Current RegionList-område, tryck CtrlAA). ELLER Klicka på Välj allt längst upp till vänster mellan rader och kolumner. Tryck på CtrlC. Tryck CtrlPage Down för att välja ett annat ark, välj sedan cell A1. Tryck enter. Kopiera hela arket Kopiering av hela arket innebär att du kopierar cellerna, sidinställningsparametrarna och det definierade intervallet Namn. Alternativ 1: Flytta muspekaren till en arkflik. Tryck Ctrl och håll muspekaren för att dra arket till en annan plats. Släpp musknappen och Ctrl-tangenten. Alternativ 2: Högerklicka på lämplig arkflik. På snabbmenyn väljer du Flytta eller Kopiera. I dialogrutan Flytta eller kopiera kan du kopiera arket antingen till en annan plats i den aktuella arbetsboken eller till en annan arbetsbok. Var noga med att markera kryssrutan Skapa en kopia. Alternativ 3: Välj Ordna från fönstermenyn. Välj Kakel till kakel alla öppna arbetsböcker i fönstret. Använd Alternativ 1 (dra arket medan du trycker på Ctrl) för att kopiera eller flytta ett ark. Sortering efter kolumner Standardinställningen för sortering i Ascending eller Descending order är för rad. Sortera efter kolumner: På menyn Data väljer du Sortera och sedan Alternativ. Välj alternativet Sortera vänster till höger och klicka på OK. I rutan Sortera efter val av sorteringsdialogrutan väljer du det radnummer som kolumnerna ska sorteras till och klickar på OK. Beskrivande statistik Data Analysis ToolPak har ett beskrivande statistikverktyg som ger dig ett enkelt sätt att beräkna sammanfattningsstatistik för en uppsättning provdata. Sammanfattningsstatistik inkluderar Mean, Standard Error, Median, Mode, Standardavvikelse, Varians, Kurtosis, Skewness, Range, Minimum, Maximum, Sum och Count. Detta verktyg eliminerar behovet av att skriva individuella funktioner för att hitta vart och ett av dessa resultat. Excel innehåller utarbetade och anpassningsbara verktygsfält, till exempel standardverktygsfältet som visas här: Några av ikonerna är användbara matematiska beräkningar: är Autosum-ikonen, som går in i formel summan () för att lägga till ett antal celler. är FunctionWizard-ikonen, som ger dig tillgång till alla tillgängliga funktioner. är GraphWizard-ikonen, vilket ger tillgång till alla tillgängliga graftyper, som visas i den här skärmen: Excel kan användas för att generera mätvärden för placering och variabilitet för en variabel. Antag att vi önskar hitta beskrivande statistik för en provdata: 2, 4, 6 och 8. Steg 1. Välj rullgardinsmenyn Verktyg, om du ser dataanalys klickar du på det här alternativet, annars klickar du på tillägg . möjlighet att installera analysverktygspaket. Steg 2. Klicka på alternativet för dataanalys. Steg 3. Välj Beskrivande statistik från listan Analysverktyg. Steg 4. När dialogrutan visas: Ange A1: A4 i rutan för ingångsintervall, A1 är ett värde i kolumn A och rad 1. i detta fall är detta värde 2. Med samma teknik anger du andra värden tills du når den sista. Om ett prov består av 20 nummer kan du välja t. ex. A1, A2, A3 etc. som ingångsintervall. Steg 5. Välj ett utmatningsområde. i detta fall B1. Klicka på sammanfattande statistik för att se resultaten. När du klickar på OK. Du kommer att se resultatet i det valda området. Som du kommer att se är medelvärdet av provet 5, medianen är 5, standardavvikelsen är 2,581989, provvarianansen är 6,6666667, intervallet är 6 och så vidare. Var och en av dessa faktorer kan vara viktig vid beräkningen av olika statistiska förfaranden. Normal Distribution Överväg problemet med att hitta sannolikheten för att få mindre än ett visst värde under någon normal sannolikhetsfördelning. Som ett illustrativt exempel, låt oss anta att SAT-poängen rikstäckande distribueras normalt med en genomsnittlig och standardavvikelse på 500 respektive 100. Svar på följande frågor baserat på den givna informationen: A: Vilken sannolikhet är det att ett slumpmässigt valt studentpoäng blir mindre än 600 poäng B: Vilken är sannolikheten att ett slumpmässigt valt studentpoäng kommer att överstiga 600 poäng C: Vad är sannolikheten att ett slumpmässigt valt studentpoäng kommer att ligga mellan 400 och 600 Tips: Med Excel kan du hitta sannolikheten för att få ett värde som är ungefär mindre än eller lika med ett givet värde. I ett problem, när genomsnittet och standardavvikelsen för befolkningen ges, måste du använda sunt förnuft för att hitta olika sannolikheter baserat på frågan eftersom du vet att området under en normal kurva är 1. I arbetsarket välj cell där du vill att svaret ska visas. Antag att du valde cell nummer ett, A1. Från menyerna, välj quotinsert pull-downquot. Steg 2-3 Från menyerna, välj insert och klicka sedan på funktionen Funktion. Steg 4. Efter att du har klickat på funktionen Funktion visas dialogrutan Klistra in funktion från Funktionskategori. Välj Statistisk sedan NORMDIST från rutan Funktionsnamn Klicka på OK Steg 5. När du har klickat på OK visas distributionsrutan NORMDIST: i. Ange 600 i X (värdefältet) ii. Ange 500 i Mean boxen iii. Ange 100 i rutan Standardavvikelse iv. Skriv quottruequot i den kumulativa rutan och klicka sedan på OK. Som du ser värdet 0.84134474 visas i A1, vilket indikerar sannolikheten för att en slumpmässigt vald elever gör poäng under 600 poäng. Med hjälp av sunt förnuft kan vi svara på en del quotbquot genom att subtrahera 0,84134474 från 1. Så svaret på delquotquot är 1 - 0.8413474 eller 0.158653. Det här är sannolikheten för att en slumpmässigt valda studentpoäng är större än 600 poäng. För att svara på delkvotot, använd samma tekniker för att hitta sannolikheterna eller området på vänster sida av värdena 600 och 400. Eftersom dessa områden eller sannolikheter överlappar varandra för att svara på frågan borde du subtrahera mindre sannolikhet från större sannolikhet. Svaret är lika med 0,84134474 - 0,155865526 som är 0,68269. Skärmbilden ska se ut som följande: Beräkna värdet på en slumpmässig variabel som ofta kallas quotxquot-värdet. Du kan använda NORMINV från funktionsfältet för att beräkna ett värde för den slumpmässiga variabeln - om sannolikheten för den vänstra sidan av denna variabel anges. I själva verket bör du använda denna funktion för att beräkna olika procentuella parametrar. I detta problem kan man fråga vad som är poängen för en student vars percentil är 90. Det betyder att cirka 90 av eleverna är mindre än detta nummer. Å andra sidan om vi ombads att göra detta problem för hand, skulle vi ha beräknat x-värdet med normalfördelningsformeln x m zd. Nu kan vi använda Excel för att beräkna P90. I Paste-funktionen, klicka på statistiken och klicka sedan på NORMINV. Skärmbilden skulle se ut som följer: När du ser NORMINV visas dialogrutan. jag. Ange 0,90 för sannolikheten (det betyder att ungefär 90 poäng är mindre än det värde vi söker) ii. Ange 500 för medelvärdet (detta är medelvärdet av den normala fördelningen i vårt fall) iii. Ange 100 för standardavvikelsen (det här är standardavvikelsen för normalfördelningen i vårt fall) I slutet av den här skärmen kommer du att se formelresultatet som är cirka 628 poäng. Det innebär att de 10 bästa av eleverna gjorde bättre än 628. Förtroendeintervall för medelvärdet Antag att vi önskar uppskatta ett konfidensintervall för medeltalet av en befolkning. Beroende på storleken på din samplingsstorlek kan du använda ett av följande fall: Stora provstorlek (n är större än, t ex 30): Den allmänna formeln för att utveckla ett konfidensintervall för en population betyder: I denna formel är den genomsnittliga av provet Z är intervallkoefficienten, som kan hittas från det normala distributionsbordet (till exempel är intervallkoefficienten för en 95 konfidensnivå 1,96). S är standardavvikelsen för provet och n är provstorleken. Nu vill vi visa hur Excel används för att utveckla ett visst konfidensintervall för ett populationsmedel baserat på en provinformation. Som du ser för att utvärdera denna formel behöver du quotthe mean av samplequot och felmarginalen Excel kommer automatiskt att beräkna dessa kvantiteter för dig. Det enda du behöver göra är att lägga till felmarginalen till medelvärdet av provet, Hitta den övre gränsen för intervallet och subtrahera felmarginalen från medelvärdet till den nedre gränsen för intervallet. För att visa hur Excel hittar dessa kvantiteter kommer vi att använda datasatsen, som innehåller timmarna av 36 arbetsstudentsstuderande här, vid University of Baltimore. Dessa siffror visas i cellerna A1 till A36 på ett Excel-arbetsblad. Efter inmatningen av data följde vi det beskrivande statistiska förfarandet för att beräkna de okända kvantiteterna. Det enda ytterligare steget är att klicka på konfidensintervallet i den beskrivande statistiska dialogrutan och ange den angivna konfidensnivån, i det här fallet 95. Här är ovanstående procedurer steg för steg: Steg 1. Ange data i cellerna A1 till A36 (på kalkylbladet) Steg 2. Från menyerna välj Verktyg Steg 3. Klicka på Data Analysis, välj sedan alternativet Beskrivande statistik och klicka sedan på OK. På den beskrivande statistiska dialogrutan klickar du på Sammandragsstatistik. När du har gjort det, klicka på konfidensintervallnivån och skriv 95 - eller i andra problem oavsett konfidensintervall du önskar. I rutan Utmatningsområde anger du B1 eller vilken plats du önskar. Klicka nu på OK. Skärmbilden skulle se ut som följer: Som du ser visar kalkylbladet att medelvärdet av provet är 6.902777778 och det absoluta värdet av felmarginalen 0,231678109. Detta medelvärde är baserat på denna provinformation. Ett 95 konfidensintervall för UB-studiestudentens timmeinkomst har en övre gräns på 6.902777778 0.231678109 och en nedre gräns på 6.902777778 - 0.231678109. Å andra sidan kan vi säga att alla de intervaller som bildas på detta sätt innehåller 95 populationens medelvärde. Eller för praktiska ändamål kan vi vara 95 övertygade om att medeltalet av befolkningen ligger mellan 6.902777778 - 0.231678109 och 6.902777778 0.231678109. Vi kan vara minst 95 övertygade om att intervall 6,68 och 7,13 innehåller den genomsnittliga timmarsinkomsten för en arbetsstudent. Smal provstorlek (säg mindre än 30) Om provet n är mindre än 30 eller vi måste använda det lilla provet för att utveckla ett konfidensintervall för medeltalet av en population. Den allmänna formeln för att utveckla konfidensintervaller för populationen betyder baserat på litet ett prov är: I denna formel är medelvärdet av provet. är intervallkoefficienten som tillhandahåller ett område i överdelen av en t-fördelning med n-1 frihetsgrader som kan hittas från en t-fördelningstabell (till exempel är intervallkoefficienten för 90-konfidensnivå 1.833 om provet är 10). S är standardavvikelsen för provet och n är provstorleken. Nu vill du se hur Excel används för att utveckla ett visst konfidensintervall för ett populationmedel baserat på denna lilla provinformation. Som du ser, för att utvärdera denna formel behöver du quotthe mean av samplequot och felmarginalen Excel kommer automatiskt att beräkna dessa kvantiteter som det gjorde för stora prover. Återigen är de enda sakerna du behöver göra: Lägg felmarginalen till medelvärdet av provet, hitta intervallets övre gräns och subtrahera felmarginalen från medelvärdet för att hitta intervallets nedre gräns. För att visa hur Excel hittar dessa kvantiteter kommer vi att använda datasatsen, som innehåller timmarsinkomsterna för 10 arbetsstudentsstudenter här vid University of Baltimore. Dessa siffror visas i cellerna A1 till A10 på ett Excel-arbetsblad. Efter att ha skrivit in data följer vi det beskrivande statistiska förfarandet för att beräkna de okända kvantiteterna (exakt hur vi hittade mängder för stort urval). Här följer proceduren i steg-för-steg-form: Steg 1. Ange data i cellerna A1 till A10 på kalkylbladet Steg 2. Från menyerna välj Verktyg Steg 3. Klicka på Data Analysis och välj sedan alternativet Beskrivande statistik. Klicka på OK i den beskrivande statistikdialogrutan, klicka på Sammanfattningsstatistik, klicka på konfidensintervallnivån och skriv in 90 eller i andra problem beroende på vilket konfidensintervall du önskar. I rutan Utmatningsområde anger du B1 eller vilken plats du vill ha. Klicka nu på OK. Skärmbilden kommer att se ut som följande: Nu, beräknar du förtroendeintervallet för det stora provet, baserat på den här lilla provinformationen, som beräkningen av konfidensintervallet för det stora provet. Förtroendeintervallet är: 6,8 0,414426102 eller 6,39 7,21. Vi kan vara minst 90 förtroende att intervallet 6,39 och 7,21 innehåller det sanna medlet för befolkningen. Test av hypotesen beträffande befolkningen betyder igen, vi måste skilja två fall med avseende på storleken på ditt prov Stora provstorlek (säg över 30): I det här avsnittet vill du veta hur Excel kan användas för att utföra ett hypotestest om en befolkningsmedelvärde. Vi kommer att använda timmarsinkomsterna för olika arbetsstudiestudenter än de som introducerades tidigare i avsnittet om konfidensintervall. Data matas in i cellerna A1 till A36. Målsättningen är att testa följande Null - och Alternativhypotes: Nollhypotesen anger att den genomsnittliga timmarsinkomsten för en studiestudent motsvarar 7 per timme, men den alternativa hypotesen indikerar att den genomsnittliga timlönen inte är lika med 7 per timme. Jag kommer att upprepa de steg som tas i beskrivande statistik och i slutet kommer att visa hur man hittar värdet av teststatistiken i detta fall, z, med hjälp av en cellformel. Steg 1. Ange data i cellerna A1 till A36 (på kalkylbladet) Steg 2. Från menyerna välj Verktyg Steg 3. Klicka på Data Analysis och välj alternativet Beskrivande statistik, klicka på OK. På den beskrivande statistiska dialogrutan klickar du på Sammandragsstatistik. Välj rutan Utmatningsområde, skriv B1 eller vilken plats du vill ha. Klicka nu på OK. (För att beräkna värdet av teststatistiken söka efter medelvärdet av provet, då standardfelet. I denna utgång ligger dessa värden i cellerna C3 och C4.) Steg 4. Välj cell D1 och ange cellformeln (C3-7 ) C4. Skärmbilden ska se ut som följande: Värdet i cell D1 är värdet av teststatistiken. Eftersom detta värde faller i acceptintervallet -1,96 till 1,96 (från det normala distributionsbordet) misslyckas vi att neka hypotesen. Små provstorlek (säg mindre än 30): Med hjälp av steg som tagit det stora provstorleksfallet kan Excel användas för att utföra en hypotes för småprovfall. Låt oss använda den timliga inkomsten för 10 arbetsstudenter på UB för att utföra följande hypotes. Nollhypotesen indikerar att en arbetstidsstudents genomsnittliga timmeinkomst är lika med 7 per timme. Den alternativa hypotesen indikerar att genomsnittlig timelön inte är lika med 7 per timme. Jag kommer att upprepa de steg som tas i beskrivande statistik och i slutet kommer att visa hur man hittar värdet av teststatistiken i detta fall quottquot med hjälp av en cellformel. Steg 1. Ange data i cellerna A1 till A10 (på kalkylbladet) Steg 2. Från menyerna välj Verktyg Steg 3. Klicka på Data Analysis och välj alternativet Beskrivande statistik. Klicka på OK. På den beskrivande statistiska dialogrutan klickar du på Sammandragsstatistik. Välj rutorna Utmatningsområde, ange B1 eller vilken plats du valde. Återigen, klicka på OK. (För att beräkna värdet av teststatistiken söka efter medelvärdet av provet är standardfelet, i dessa utgångar ligger dessa värden i cellerna C3 och C4.) Steg 4. Välj cell D1 och ange cellformeln (C3-7) C4. Skärmbilden skulle se ut som följande: Eftersom värdet av teststatistik t -0.66896 faller i acceptintervallet -2.262 till 2.262 (från t-tabellen, där 0,025 och graderna av frihet är 9), misslyckas vi att avvisa nollhypotesen. Skillnad mellan medelvärdet av två populationer I det här avsnittet kommer vi att visa hur Excel används för att utföra ett hypotesprov om skillnaden mellan två populationer, förutsatt att populationerna har lika stora variationer. Uppgifterna i detta fall tas från olika kontor här vid University of Baltimore. Jag samlade in timmeinkomstuppgifterna för 36 slumpmässigt utvalda arbetsstudiestudenter och 36 studentassistenter. Timinginkomsten för arbetsstudentstuderande var 6-8 medan timmarsintervallet för studentassistenter var 6-9. Huvudsyftet med denna hypotesprovning är att se om det finns en signifikant skillnad mellan de två populationernas medel. NULL - och ALTERNATIV-hypotesen är att medlen är lika och medlen inte är lika. Med hänvisning till kalkylbladet valde jag A1 och A2 som etikettcentraler. Arbetsstudiestudentens inkomster för en provstorlek 36 visas i cellerna A2: A37. och studentassistenternas inkomster för en provstorlek 36 visas i cellerna B2: B37 Data för arbetsstudie Student: 6, 6, 6, 6, 6, 6, 6,5, 6,5, 6,5, 6,5, 6,5, 6,5, 7, 7, 7, 7, 7, 7, 7, 7,5, 7,5, 7,5, 7,5, 7,5, 7,5, 8, 8, 8, 8, 8, 8, 8, 8. Data för studentassistent: 6 6,6 6,6 6,5 6,5 6,5 7 7 7 7 7 7,5 7,5 7,5 7,5 8 8 8 8 8 8 , 8, 8, 8,5, 8,5, 8,5, 8,5, 8,5, 9, 9, 9, 9. Använd beskrivningen av beskrivande statistik för att beräkna avvikelserna för de två proverna. Excel-förfarandet för att testa skillnaden mellan de två befolkningsmedlen kommer att kräva information om skillnaderna mellan de två populationerna. Eftersom skillnaderna mellan de två populationerna är okända bör de ersättas med provvariationer. Den beskrivande för båda proverna visar att variansen av första provet är s 1 2 0,55546218. medan variansen av det andra provet s 2 2 0,969748. För att utföra den önskade testhypotesen med Excel kan följande steg vidtas: Steg 1. Från menyerna välj Verktyg och klicka sedan på alternativet Data Analysis. Steg 2. När dialogrutan Dataanalys visas: Välj z-Test: Två exempel på medel och klicka sedan på OK Steg 3. När z-Test: Two Sample for means dialogrutan visas: Ange A1: A36 i ruta 1 (arbetsstudiestudenter timelön) Ange B1: B36 i rutan 2 för variabel 2 (studentassistent timelön) Ange 0 i rutan Hypotesemåttlig skillnad (om du vill testa en medelskillnad annat än 0, ange det värdet) Ange variansen för det första provet i variabel 1-variansrutan Ange variansen för det andra provet i rutan Variabel 2-varians och välj Etiketter Ange 0,05 eller, vilken nivå av betydelse du vill ha i alfakassetten Välj ett lämpligt utmatningsområde för resultat, jag valde C19. klicka sedan på OK. Värdet av teststatistik z-1.9845824 visas i vårt fall i cell D24. Avvisningsregeln för detta test är z 1,96 från det normala distributionsbordet. I Excel-utgången är dessa värden för ett tvåstegstest z 1.959961082. Eftersom värdet av teststatistiken z-1.9845824 är mindre än -1,959961082 avvisar vi nollhypotesen. We can also draw this conclusion by comparing the p-value for a two tail - test and the alpha value. Since p-value 0.047190813 is less than a0.05 we reject the null hypothesis. Overall we can say, based on the sample results, the two populations means are different. Small Samples: n 1 OR n 2 are less than 30 In this section we will show how Excel is used to conduct a hypothesis test about the difference between two population means. - Given that the populations have equal variances when two small independent samples are taken from both populations. Similar to the above case, the data in this case are taken from various offices here at the University of Baltimore. I collected hourly income data of 11 randomly selected work-study students and 11 randomly selected student assistants. The hourly income range for both groups was similar range, 6 - 8 and 6-9. The main objective in this hypothesis testing is similar too, to see whether there is a significant difference between the means of the two populations. The NULL and the ALTERNATIVE hypothesis are that the means are equal and they are not equal, respectively. Referring to the spreadsheet, we chose A1 and A2 as label centers. The work-study students hourly income for a sample size 11 are shown in cells A2:A12 . and the student assistants hourly income for a sample size 11 is shown in cells B2:B12 . Unlike previous case, you do not have to calculate the variances of the two samples, Excel will automatically calculate these quantities and use them in the calculation of the value of the test statistic. Similar to the previous case, but a bit different in step 2, to conduct the desired test hypothesis with Excel the following steps can be taken: Step 1. From the menus select Tools then click on the Data Analysis option. Step 2. When the Data Analysis dialog box appears: Choose t-Test: Two Sample Assuming Equal Variances then click OK Step 3 When the t-Test: Two Sample Assuming Equal Variances dialog box appears : Enter A1:A12 in the variable 1 range box (work-study student hourly income) Enter B1:B12 in the variable 2 range box (student assistant hourly income) Enter 0 in the Hypothesis Mean Difference box(if you desire to test a mean difference other than zero, enter that value) then select Labels Enter 0.05 or, whatever level of significance you desire, in the Alpha box Select a suitable Output Range for the results, I chose C1, then click OK. The value of the test statistic t-1.362229828 appears, in our case, in cell D10. The rejection rule for this test is t 2.086 from the t distribution table where the t value is based on a t distribution with n 1 - n 2 -2 degrees of freedom and where the area of the upper one tail is 0.025 ( that is equal to alpha2). In the Excel output the values for a two-tail test are t 2.085962478. Since the value of the test statistic t-1.362229828, is in an acceptance range of t 2.085962478, we fail to reject the null hypothesis. We can also draw this conclusion by comparing the p-value for a two-tail test and the alpha value. Since the p-value 0.188271278 is greater than a0.05 again . we fail to reject the null hypothesis. Overall we can say, based on sample results, the two populations means are equal. Enter data in an Excel work sheet starting with cell A2 and ending with cell C8. The following steps should be taken to find the proper output for interpretation. Step 1. From the menus select Tools and click on Data Analysis option. Step 2. When data analysis dialog appears, choose Anova single-factor option enter A2:C8 in the input range box. Select labels in first row. Step3. Select any cell as output(in here we selected A11). Click OK. The general form of Anova table looks like following: Source of Variation Suppose the test is done at level of significance a 0.05, we reject the null hypothesis. This means there is a significant difference between means of hourly incomes of student assistants in these departments. The Two-way ANOVA Without Replication In this section, the study involves six students who were offered different hourly wages in three different department services here at the University of Baltimore. The objective is to see whether the hourly incomes are the same. Therefore, we can consider the following: Treatment: Hourly payments in the three departments Blocks: Each student is a block since each student has worked in the three different departments The general form of Anova table would look like: Source of Variation Degrees of freedom To find the Excel output for the above data the following steps can be taken: Step 1. From the menus select Tools and click on Data Analysis option. Step2. When data analysis box appears: select Anova two-factor without replication then Enter A2: D8 in the input range. Select labels in first row. Step3. Select an output range (in here we selected A11) then OK. Source of Variation NOTE: FMSTMSE 0.9805560.497222 1.972067 F 3.33 from table (5 numerator DF and 10 denominator DF) Since 1.972067 Goodness-of-Fit Test for Discrete Random Variables The CHI-SQUARE distribution can be used in a hypothesis test involving a population variance. However, in this section we would like to test and see how close a sample results are to the expected results. Example: The Multinomial Random Variable In this example the objective is to see whether or not based on a randomly selected sample information the standards set for a population is met. There are so many practical examples that can be used in this situation. For example it is assumed the guidelines for hiring people with different ethnic background for the US government is set at 70(WHITE), 20(African American) and 10(others), respectively. A randomly selected sample of 1000 US employees shows the following results that is summarized in a table. EXPECTED NUMBER OF EMPLOYEES OBSERVED FROM SAMPLE As you see the observed sample numbers for groups two and three are lower than their expected values unlike group one which has a higher expected value. Is this a clear sign of discrimination with respect to ethnic background Well depends on how much lower the expected values are. The lower amount might not statistically be significant. To see whether these differences are significant we can use Excel and find the value of the CHI-SQUARE. If this value falls within the acceptance region we can assume that the guidelines are met otherwise they are not. Now lets enter these numbers into Excel spread - sheet. We used cells B7-B9 for the expected proportions, C7-C9 for the observed values and D7-D9 for the expected frequency. To calculate the expected frequency for a category, you can multiply the proportion of that category by the sample size (in here 1000). The formula for the first cell of the expected value column, D7 is 1000B7. To find other entries in the expected value column, use the copy and the paste menu as shown in the following picture. These are important values for the chi-square test. The observed range in this case is C7: C9 while the expected range is D7: D9. The null and the alternative hypothesis for this test are as follows: H A . The population proportions are not P W 0.70, P A 0.20 and P O 0.10 Now lets use Excel to calculate the p-value in a CHI-SQUARE test. Step 1. Select a cell in the work sheet, the location which you like the p value of the CHI-SQUARE to appear. We chose cell D12. Step 2. From the menus, select insert then click on the Function option, Paste Function dialog box appears. Step 3. Refer to function category box and choose statistical . from function name box select CHITEST and click on OK . Step 4. When the CHITEST dialog appears: Enter C7: C9 in the actual-range box then enter D7: D9 in the expected-range box, and finally click on OK . The p-value will appear in the selected cell, D12. As you see the p value is 0.002392 which is less than the value of the level of significance (in this case the level of significance, a 0.10). Hence the null hypothesis should be rejected. This means based on the sample information the guidelines are not met. Notice if you type CHITEST(C7:C9,D7:D9) in the formula bar the p-value will show up in the designated cell. NOTE: Excel can actually find the value of the CHI-SQUARE. To find this value first select an empty cell on the spread sheet then in the formula bar type CHIINV(D12,2). D12 designates the p-Value found previously and 2 is the degrees of freedom (number of rows minus one). The CHI-SQUARE value in this case is 12.07121. If we refer to the CHI-SQUARE table we will see that the cut off is 4.60517 since 12.071214.60517 we reject the null. The following screen shot shows you how to the CHI-SQUARE value. Test of Independence: Contingency Tables The CHI-SQUARE distribution is also used to test and see whether two variables are independent or not. For example based on sample data you might want to see whether smoking and gender are independent events for a certain population. The variables of interest in this case are smoking and the gender of an individual. Another example in this situation could involve the age range of an individual and his or her smoking habit. Similar to case one data may appear in a table but unlike the case one this table may contains several columns in addition to rows. The initial table contains the observed values. To find expected values for this table we set up another table similar to this one. To find the value of each cell in the new table we should multiply the sum of the cell column by the sum of the cell row and divide the results by the grand total. The grand total is the total number of observations in a study. Now based on the following table test whether or not the smoking habit and gender of the population that the following sample taken from are independent. On the other hand is that true that males in this population smoke more than females You could use formula bar to calculate the expected values for the expected range. For example to find the expected value for the cell C5 which is replaced in c11 you could click on the formula bar and enter C6D5D6 then enter in cell C11. Step 1. Observed Range b4:c5 Smoking and gender So the observed range is b4:c5 and the expected range is b10:c11. Step 3. Click on fx (paste function) Step 4. When Paste Function dialog box appears, click on Statistical in function category and CHITEST in the function name then click OK. When the CHITEST box appears, enter b4:c5 for the actual range, then b10:c11 for the expected range. Step 5. Click on OK (the p-value appears). 0.477395 Conclusion: Since p-value is greater than the level of significance (0.05), fails to reject the null. This means smoking and gender are independent events. Based on sample information one can not assure females smoke more than males or the other way around. Step 6. To find the chi-square value, use CHINV function, when Chinv box appears enter 0.477395 for probability part, then 1 for the degrees of freedom. Degrees of freedom(number of columns-1)X(number of rows-1) Test Hypothesis Concerning the Variance of Two Populations In this section we would like to examine whether or not the variances of two populations are equal. Whenever independent simple random samples of equal or different sizes such as n 1 and n 2 are taken from two normal distributions with equal variances, the sampling distribution of s 1 2 s 2 2 has F distribution with n 1 - 1 degrees of freedom for the numerator and n 2 - 1 degrees of freedom for the denominator. In the ratio s 1 2 s 2 2 the numerator s 1 2 and the denominator s 2 2 are variances of the first and the second sample, respectively. The following figure shows the graph of an F distribution with 10 degrees of freedom for both the numerator and the denominator. Unlike the normal distribution as you see the F distribution is not symmetric. The shape of an F distribution is positively skewed and depends on the degrees of freedom for the numerator and the denominator. The value of F is always positive. Now let see whether or not the variances of hourly income of student-assistant and work-study students based on samples taken from populations previously are equal. Assume that the hypothesis test in this case is conducted at a 0.10. The null and the alternative are: Rejection Rule: Reject the null hypothesis if Flt F 0.095 or Fgt F 0.05 where F, the value of the test statistic is equal to s 1 2 s 2 2. with 10 degrees of freedom for both the numerator and the denominator. We can find the value of F .05 from the F distribution table. If s 1 2 s 2 2. we do not need to know the value of F 0.095 otherwise, F 0.95 1 F 0.05 for equal sample sizes. A survey of eleven student-assistant and eleven work-study students shows the following descriptive statistics. Our objective is to find the value of s 1 2 s 2 2. where s 1 2 is the value of the variance of student assistant sample and s 2 2 is the value of the variance of the work study students sample. As you see these values are in cells F8 and D8 of the descriptive statistic output. To calculate the value of s 1 2 s 2 2. select a cell such as A16 and enter cell formula F8D8 and enter. This is the value of F in our problem. Since this value, F1.984615385, falls in acceptance area we fail to reject the null hypothesis. Hence, the sample results do support the conclusion that student assistants hourly income variance is equal to the work study students hourly income variance. The following screen shoot shows how to find the F value. We can follow the same format for one tail test(s). Linear Correlation and Regression Analysis In this section the objective is to see whether there is a correlation between two variables and to find a model that predicts one variable in terms of the other variable. There are so many examples that we could mention but we will mention the popular ones in the world of business. Usually independent variable is presented by the letter x and the dependent variable is presented by the letter y. A business man would like to see whether there is a relationship between the number of cases of sold and the temperature in a hot summer day based on information taken from the past. He also would like to estimate the number cases of soda which will be sold in a particular hot summer day in a ball game. He clearly recorded temperatures and number of cases of soda sold on those particular days. The following table shows the recorded data from June 1 through June 13. The weatherman predicts a 94F degree temperature for June 14. The businessman would like to meet all demands for the cases of sodas ordered by customers on June 14. Now lets use Excel to find the linear correlation coefficient and the regression line equation. The linear correlation coefficient is a quantity between -1 and 1. This quantity is denoted by R . The closer R to 1 the stronger positive (direct) correlation and similarly the closer R to -1 the stronger negative (inverse) correlation exists between the two variables. The general form of the regression line is y mx b. In this formula, m is the slope of the line and b is the y-intercept. You can find these quantities from the Excel output. In this situation the variable y (the dependent variable) is the number of cases of soda and the x (independent variable) is the temperature. To find the Excel output the following steps can be taken: Step 1. From the menus choose Tools and click on Data Analysis. Step 2. When Data Analysis dialog box appears, click on correlation. Step 3. When correlation dialog box appears, enter B1:C14 in the input range box. Click on Labels in first row and enter a16 in the output range box. Click on OK. As you see the correlation between the number of cases of soda demanded and the temperature is a very strong positive correlation. This means as the temperature increases the demand for cases of soda is also increasing. The linear correlation coefficient is 0.966598577 which is very close to 1. Now lets follow same steps but a bit different to find the regression equation. Step 1. From the menus choose Tools and click on Data Analysis Step 2 . When Data Analysis dialog box appears, click on regression . Step 3. When Regression dialog box appears, enter b1:b14 in the y-range box and c1:c14 in the x-range box. Click on labels . Step 4. Enter a19 in the output range box . Note: The regression equation in general should look like Ym X b. In this equation m is the slope of the regression line and b is its y-intercept. Adjusted R Square The relationship between the number of cans of soda and the temperature is: Y 0.879202711 X 9.17800767 The number of cans of soda 0.879202711(Temperature) 9.17800767. Referring to this expression we can approximately predict the number of cases of soda needed on June 14. The weather forecast for this is 94 degrees, hence the number of cans of soda needed is equal to The number of cases of soda0.879202711(94) 9.17800767 91.82 or about 92 cases. Moving Average and Exponential Smoothing Moving Average Models: Use the Add Trendline option to analyze a moving average forecasting model in Excel. You must first create a graph of the time series you want to analyze. Select the range that contains your data and make a scatter plot of the data. Once the chart is created, follow these steps: Click on the chart to select it, and click on any point on the line to select the data series. When you click on the chart to select it, a new option, Chart, s added to the menu bar. From the Chart menu, select Add Trendline. The following is the moving average of order 4 for weekly sales: Exponential Smoothing Models: The simplest way to analyze a timer series using an Exponential Smoothing model in Excel is to use the data analysis tool. This tool works almost exactly like the one for Moving Average, except that you will need to input the value of a instead of the number of periods, k. Once you have entered the data range and the damping factor, 1- a. and indicated what output you want and a location, the analysis is the same as the one for the Moving Average model. Applications and Numerical Examples Descriptive Statistics: Suppose you have the following, n 10, data: 1.2, 1.5, 2.6, 3.8, 2.4, 1.9, 3.5, 2.5, 2.4, 3.0 Type your n data points into the cells A1 through An. Click on the Tools menu. (At the bottom of the Tools menu will be a submenu Data Analysis. , if the Analysis Tool Pack has been properly installed.) Clicking on Data Analysis. will lead to a menu from which Descriptive Statistics is to be selected. Select Descriptive Statistics by pointing at it and clicking twice, or by highlighting it and clicking on the Okay button. Within the Descriptive Statistics submenu, a. for the input range enter A1:Dn, assuming you typed the data into cells A1 to An. b. click on the output range button and enter the output range C1:C16. c. click on the Summary Statistics box d. finally, click on Okay. The Central Tendency: The data can be sorted in ascending order: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 The mean, median and mode are computed as follows: (1.2 1.5 2.6 3.8 2.4 1.9 3.5 2.5 2.4 3.0) 10 2.48 The mode is 2.4, since it is the only value that occurs twice. The midrange is (1.2 3.8) 2 2.5. Note that the mean, median and mode of this set of data are very close to each other. This suggests that the data is very symmetrically distributed. Variance: The variance of a set of data is the average of the cumulative measure of the squares of the difference of all the data values from the mean. The sample variance-based estimation for the population variance are computed differently. The sample variance is simply the arithmetic mean of the squares of the difference between each data value in the sample and the mean of the sample. On the other hand, the formula for an estimate for the variance in the population is similar to the formula for the sample variance, except that the denominator in the fraction is (n-1) instead of n. However, you should not worry about this difference if the sample size is large, say over 30. Compute an estimate for the variance of the population . given the following sorted data: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 mean 2.48 as computed earlier. An estimate for the population variance is: s 2 1 (10-1) (1.2 - 2.48) 2 (1.5 - 2.48) 2 (1.9 - 2.48) 2 (2.4 -2.48) 2 (2.4 - 2.48) 2 (2.5 - 2.48) 2 (2.6 - 2.48) 2 (3.0 - 2.48) 2 (3.5 -2.48) 2 (3.8 - 2.48) 2 (1 9) (1.6384 0.9604 0.3364 0.0064 0.0064 0.0004 0.0144 0.2704 1.0404 1.7424) 0.6684 Therefore, the standard deviation is s ( 0.6684 ) 12 0.8176 Probability and Expected Values: Newsweek reported that average take for bank robberies was 3,244 but 85 percent of the robbers were caught. Assuming 60 percent of those caught lose their entire take and 40 percent lose half, graph the probability mass function using EXCEL. Calculate the expected take from a bank robbery. Does it pay to be a bank robber To construct the probability function for bank robberies, first define the random variable x, bank robbery take. If the robber is not caught, x 3,244. If the robber is caught and manages to keep half, x 1,622. If the robber is caught and loses it all, then x 0. The associated probabilities for these x values are 0.15 (1 - 0.85), 0.34 (0.85)(0.4), and 0.51 (0.85)(0.6). After entering the x values in cells A1, A2 and A3 and after entering the associated probabilities in B1, B2, and B3, the following steps lead to the probability mass function: Click on ChartWizard. The ChartWizard Step 1 of 4 screen will appear. Highlight Column at ChartWizard Step 1 of 4 and click Next. At ChartWizard Step 2 of 4 Chart Source Data, enter B1:B3 for Data range, and click column button for Series in. A graph will appear. Click on series toward the top of the screen to get a new page. At the bottom of the Series page, is a rectangle for Category (X) axis labels: Click on this rectangle and then highlight A1:A3. At Step 3 of 4 move on by clicking on Next, and at Step 4 of 4, click on Finish. The expected value of a robbery is 1,038.08. E(X) (0)(0.51)(1622)(0.34) (3244)(0.15) 0 551.48 486.60 1038.08 The expected return on a bank robbery is positive. On average, bank robbers get 1,038.08 per heist. If criminals make their decisions strictly on this expected value, then it pays to rob banks. A decision rule based only on an expected value, however, ignores the risks or variability in the returns. In addition, our expected value calculations do not include the cost of jail time, which could be viewed by criminals as substantial. Discrete Continuous Random Variables: Binomial Distribution Application: A multiple choice test has four unrelated questions. Each question has five possible choices but only one is correct. Thus, a person who guesses randomly has a probability of 0.2 of guessing correctly. Draw a tree diagram showing the different ways in which a test taker could get 0, 1, 2, 3 and 4 correct answers. Sketch the probability mass function for this test. What is the probability a person who guesses will get two or more correct Solution: Letting Y stand for a correct answer and N a wrong answer, where the probability of Y is 0.2 and the probability of N is 0.8 for each of the four questions, the probability tree diagram is shown in the textbook on page 182. This probability tree diagram shows the branches that must be followed to show the calculations captured in the binomial mass function for n 4 and 0.2. For example, the tree diagram shows the six different branch systems that yield two correct and two wrong answers (which corresponds to 4(22) 6. The binomial mass function shows the probability of two correct answers as P(x 2 n 4, p 0.2) 6(.2)2(.8)2 6(0.0256) 0.1536 P(2) Which is obtained from excel by using the BINOMDIST Command, where the first entry is x, the second is n, and the third is mass (0) or cumulative (1) that is, entering BINOMDIST(2,4,0.2,0) IN ANY EXCEL CELL YIELDS 0.1536 AND BINOMDIST(3,4,0.2,0) YIELDS P(x3n4, p 0.2) 0.0256 BINOMDIST(4,4,0.2,0) YIELDS P(x4n4, p 0.2) 0.0016 1-BINOMDIST(1,4,0.2,1) YIELDS P(x 179 2 n 4, p 0.2) 0.1808 Normal Example: If the time required to complete an examination by those with a certain learning disability is believed to be distributed normally, with mean of 65 minutes and a standard deviation of 15 minutes, then when can the exam be terminated so that 99 percent of those with the disability can finish Solution: Because t he average and standard deviation are known, what needs to be established is the amount of time, above the mean time, such that 99 percent of the distribution is lower. This is a distance that is measured in standard deviations as given by the Z value corresponding to the 0.99 probability found in the body of Appendix B, Table 5,as shown in the textbook OR the commands entered into any cell of Excel to find this Z value is NORMINV(0.99,0,1) for 2.326342. The closest cumulative probability that can be found is 0.9901, in the row labeled 2.3 and column headed by .03, Z 2.33, which is only an approximation for the more exact 2.326342 found in Excel. Using this more exact value the calculation with mean m and standard deviation s in the following formula would be Z ( X - m ) s That is, Z ( x - 65)15 Thus, x 65 15(2.32634) 99.9 minutes. Alternatively, instead of standardizing with the Z distribution using Excel we can simply work directly with the normal distribution with a mean of 65 and standard deviation of 15 and enter NORMINV(0.99,65,15). In general to obtain the x value for which alpha percent of a normal random variables values are lower, the following NORMINV command may be used, where the first entry is a. the second is m. and the third is s. Another Example: In the early 1980s, the Toro Company of Minneapolis, Minnesota, advertised that it would refund the purchase price of a snow blower if the following winters snowfall was less than 21 percent of the local average. If the average snowfall is 45.25 inches, with a standard deviation of 12.2 inches, what is the likelihood that Toro will have to make refunds Solution: Within limits, snowfall is a continuous random variable that can be expected to vary symmetrically around its mean, with values closer to the mean occurring most often. Thus, it seems reasonable to assume that snowfall (x) is approximately normally distributed with a mean of 45.25 inches and standard deviation of 12.2 inches. Nine and one half inches is 21 percent of the mean snowfall of 45.25 inches and, with a standard deviation of 12.2 inches, the number of standard deviations between 45.25 inches and 9.5 inches is Z: Z ( x - m ) s (9.50 - 45.25)12.2 -2.93 Using Appendix B, Table 5, the textbook demonstrates the determination of P(x 163 9.50) P(z 163 -2.93) 0.17, the probability of snowfall less than 9.5 inches. Using Excel, this normal probability is obtained with the NORMDIST command, where the first entry is x, the second is mean m. the third is standard deviation s, and the fourth is CUMULATIVE (1). Entering NORMDIST(9.5,45.25,12.2,1), Gives P( x 163 9.50) 0.001693. Sampling Distribution and the Central Limit Theorem : A bakery sells an average of 24 loaves of bread per day. Sales (x) are normally distributed with a standard deviation of 4. If a random sample of size n 1 (day) is selected, what is the probability this x value will exceed 28 If a random sample of size n 4 (days) is selected, what is theprobability that xbar 179 28 Why does the answer in part 1 differ from that in part 2 1. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 4. Thus, using Excel, 0.15866 1-NORMDIST(28,24,4,1). 2. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 2 using Excel, 0.02275 1-NORMDIST(28,24,2,1). Regression Analysis: The highway deaths per 100 million vehicle miles and highway speed limits for 10 countries, are given below: (Death, Speed) (3.0, 55), (3.3, 55), (3.4, 55), (3.5, 70), (4.1, 55), (4.3, 60), (4.7, 55), (4.9, 60), (5.1, 60), and (6.1, 75). From this we can see that five countries with the same speed limit have very different positions on the safety list. For example, Britain. with a speed limit of 70 is demonstrably safer than Japan, at 55. Can we argue that, speed has little to do with safety. Use regression analysis to answer this question. Solution: Enter the ten paired y and x data into cells A2 to A11 and B2 to B11, with the death rate label in A1 and speed limits label in B1, the following steps produce the regression output. Choose Regression from Data Analysis in the Tools menu. The Regression dialog box will will appear. Note: Use the mouse to move between the boxes and buttons. Click on the desired box or button. The large rectangular boxes require a range from the worksheet. A range may be typed in or selected by highlighting the cells with the mouse after clicking on the box. If the dialog box blocks the data, it can be moved on the screen by clicking on the title bar and dragging. For the Input Y Range, enter A1 to A11, and for the Input X Range enter B1 to B11. Because the Y and X ranges include the Death and Speed labels in A1 and B1, select the Labels box with a click. Click the Output Range button and type reference cell, which in this demonstration is A13. To get the predicted values of Y (Death rates) and residuals select the Residuals box with a click. Your screen display should show a Table, clicking OK will give the SUMMARY OUTPUT, ANOVA AND RESIDUAL OUTPUT The first section of the EXCEL printout gives SUMMARY OUTPUT. The Multiple R is the square root of the R Square the computation and interpretation of which we have already discussed. The Standard Error of estimate (which will be discussed in the next chapter) is s 0.86423, which is the square root of Residual SS 5.97511 divided by its degrees of freedom, df 8, as given in the ANOVA section. We will also discuss the adjusted R-square of 0.21325 in the following chapters. Under the ANOVA section are the estimated regression coefficients and related statistics that will be discussed in detail in the next chapter. For now it is sufficient to recognize that the calculated coefficient values for the slope and y intercept are provided (b 0.07556 and a -0.29333). Next to these coefficient estimates is information on the variability in the distribution of the least-squares estimators from which these specific estimates were drawn: the column titled Std. Error contains the standard deviations (standard errors) of the intercept and slope distributions the t-ratio and p columns give the calculated values of the t statistics and associated p-values. As shown in Chapter 13, the t statistic of 1.85458 and p-value of 0.10077, for example, indicates that the sample slope (0.07556) is sufficiently different from zero, at even the 0.10 two-tail Type I error level, to conclude that there is a significant relationship between deaths and speed limits in the population. This conclusion is contrary to assertion that speed has little to do with safety. SUMMARY OUTPUT: Multiple R 0.54833, R Square 0.30067, Adjusted R Square 0.21325, Standard Error 0.86423, Observations 10 ANOVA df SS MS F P-value Regression 1 2.56889 2.56889 3.43945 0.10077 Residual 8 5.97511 0.74689 Total 9 8.54400 Coeffs. Estimate Std. Error T Stat P-value Lower 95 Upper 95 Intercept -0.29333 2.45963 -0.11926 0.90801 -5.96526 5.37860 Speed 0.07556 0.04074 1.85458 0.10077 -0.01839 0.16950 Predicted Residuals 3.86222 -0.86222 3.86222 -0.56222 3.86222 -0.46222 4.99556 -1.49556 3.86222 0.23778 4.24000 0.06000 3.86222 0.83778 4.24000 0.66000 4.24000 0.86000 5.37333 0.72667 Microsoft Excel Add-Ins Forecasting with regression requires the Excel add-in called Analysis ToolPak , and linear programming requires the Excel add-in called Solver . How you check to see if these are activated on your computer, and how to activate them if they are not active, varies with Excel version. Here are instructions for the most common versions. If Excel will not let you activate Data Analysis and Solver, you must use a different computer. Excel 20022003: Start Excel, then click Tools and look for Data Analysis and for Solver. If both are there, press Esc (escape) and continue with the respective assignment. Otherwise click Tools, Add-Ins, and check the boxes for Analysis ToolPak and for Solver, then click OK. Click Tools again, and both tools should be there. Excel 2007: Start Excel 2007 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the 8220Office Button8221 at top left - click the Excel Options button near the bottom of the resulting window - click the Add-ins button on the left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Excel 2010: Start Excel 2010 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the File tab at top left - click the Options button near the bottom of the left side - click the Add-ins button near the bottom left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Solving Linear Programs by Excel Some of these examples can be modified for other types problems Computer-assisted Learning: E-Labs and Computational Tools My teaching style deprecates the plug the numbers into the software and let the magic box work it out approach. Personal computers, spreadsheets, e. g. Excel. professional statistical packages (e. g. such as SPSS), and other information technologies are now ubiquitous in statistical data analysis. Without using these tools, one cannot perform any realistic statistical data analysis on large data sets. The appearance of other computer software, JavaScript Applets. Statistical Demonstrations Applets. and Online Computation are the most important events in the process of teaching and learning concepts in model-based statistical decision making courses. These tools allow you to construct numerical examples to understand the concepts, and to find their significance for yourself. Use any or online interactive tools available on the WWW to perform statistical experiments (with the same purpose, as you used to do experiments in physics labs to learn physics) to understand statistical concepts such as Central Limit Theorem are entertaining and educating. Computer-assisted learning is similar to the experiential model of learning. The adherents of experiential learning are fairly adamant about how we learn. Learning seldom takes place by rote. Learning occurs because we immerse ourselves in a situation in which we are forced to perform and think. You get feedback from the computer output and then adjust your thinking-process if needed. A SPSS-Example . SPSS-Examples . SPSS-More Examples . (Statistical Package for the Social Sciences) is a data management and analysis product. It can perform a variety of data analysis and presentation functions, including statistical analyses and graphical presentation of data. SAS (Statistical Analysis System) is a system of software packages some of its basic functions and uses are: database management inputting, cleaning and manipulating data, statistical analysis, calculating simple statistics such as means, variances, correlations running standard routines such as regressions. Available at: SPSSSAS Packages on Citrix (Installing and Accessing ) Use your email ID and Password: Technical Difficulties OTS Call Center (401) 837-6262 Excel Examples. Excel More Examples It is Excellent for Descriptive Statistics, and getting acceptance is improving, as computational tool for Inferential Statistics. The Value of Performing Experiment: If the learning environment is focused on background information, knowledge of terms and new concepts, the learner is likely to learn that basic information successfully. However, this basic knowledge may not be sufficient to enable the learner to carry out successfully the on-the-job tasks that require more than basic knowledge. Thus, the probability of making real errors in the business environment is high. On the other hand, if the learning environment allows the learner to experience and learn from failures within a variety of situations similar to what they would experience in the real world of their job, the probability of having similar failures in their business environment is low. This is the realm of simulations-a safe place to fail. The appearance of statistical software is one of the most important events in the process of decision making under uncertainty. Statistical software systems are used to construct examples, to understand the existing concepts, and to find new statistical properties. On the other hand, new developments in the process of decision making under uncertainty often motivate developments of new approaches and revision of the existing software systems. Statistical software systems rely on a cooperation of statisticians, and software developers. Beside the professional statistical software Online statistical computation . and the use of a scientific calculator is required for the course. A Scientific Calculator is the one, which has capability to give you, say, the result of square root of 5. Any calculator that goes beyond the 4 operations is fine for this course. These calculators allow you to perform simple calculations you need in this course, for example, enabling you to take square root, to raise e to the power of say, 0.36. och så vidare. These types of calculators are called general Scientific Calculators. There are also more specific and advanced calculators for mathematical computations in other areas such as Finance, Accounting, and even Statistics. The last one, for example, computes mean, variance, skewness, and kurtosis of a sample by simply entering all data one-by-one and then pressing any of the mean, variance, skewness, and kurtosis keys. Without a computer one cannot perform any realistic statistical data analysis. Students who are signing up for the course are expected to know the basics of Excel. As a starting point, you need visiting the Excel Web site created for this course. If you are challenged by or unfamiliar with Excel, you may seek tutorial help from the Academic Resource Center at 410-837-5385, E-mail. What and How to Hand-in My Computer Assignment For the computer assignment I do recommend in checking your hand computation homework, and checking some of the numerical examples from your textbook. As part of your homework assignment you don not have to hand in the printout of the computer assisted learning, however, you must include within your handing homework a paragraph entitled Computer Implementation describing your (positive or negative) experience. Interesting and Useful Sites The Copyright Statement: The fair use, according to the 1996 Fair Use Guidelines for Educational Multimedia. of materials presented on this Web site is permitted for non-commercial and classroom purposes only. This site may be mirrored intact (including these notices), on any server with public access. All files are available at home. ubalt. eduntsbarshBusiness-stat for mirroring. Kindly e-mail me your comments, suggestions, and concerns. Tack. EOF: CopyRights 1994-2015.Moving Average: What it is and How to Calculate it Watch the video or read the article below: A moving average is a technique to get an overall idea of the trends in a data set it is an average of any subset of numbers. Det rörliga genomsnittet är extremt användbart för prognoser för långsiktiga trender. Du kan beräkna det under en viss tid. Om du till exempel har försäljningsdata i en tjugoårsperiod kan du beräkna ett femårigt glidande medelvärde, ett fyrårigt glidande medelvärde, ett treårigt glidande medelvärde och så vidare. Aktiemarknadsanalytiker kommer ofta att använda ett 50 eller 200 dagars glidande medelvärde för att hjälpa dem att se trender på aktiemarknaden och (förhoppningsvis) prognostisera var aktierna är på väg. Ett medelvärde representerar värdet 8220middling8221 av en uppsättning tal. Det rörliga genomsnittet är exakt detsamma, men genomsnittet beräknas flera gånger för flera delsatser av data. Om du till exempel vill ha ett tvåårigt glidande medelvärde för en dataset från 2000, 2001, 2002 och 2003, skulle du hitta medelvärden för deluppsatserna 20002001, 20012002 och 20022003. Flyttvärdena brukar avbildas och visas bäst. Beräkning av ett 5-årigt rörligt genomsnitt Exempel Exempelprov: Beräkna ett femårigt glidande medelvärde från följande dataset: (4M 6M 5M 8M 9M) 5 6,4M Genomsnittlig försäljning för den andra delmängden om fem år (2004 8211 2008). centrerad runt 2006, är 6,6M: (6M 5M 8M 9M 5M) 5 6,6M Den genomsnittliga försäljningen för den tredje delmängden på fem år (2005 8211 2009). centrerad runt 2007, är 6,6M: (5M 8M 9M 5M 4M) 5 6,2M Fortsätt att beräkna varje femårsmedel tills du når slutet av uppsättningen (2009-2013). Detta ger dig en serie poäng (medelvärden) som du kan använda för att plotta ett diagram över glidande medelvärden. I följande Excel-tabell visas de glidande medelvärdena beräknade för 2003-2012 tillsammans med en scatterplot av data: Titta på videon eller läs stegen nedan: Excel har en kraftfull tillägg, Data Analysis Toolpak (hur man laddar data Analysis Toolpak) som ger dig många extra alternativ, inklusive en automatiserad glidande medelfunktion. Funktionen beräknar inte bara det glidande medlet för dig, det grafar också de ursprungliga dataen samtidigt. vilket sparar dig en hel del tangenttryckningar. Excel 2013: Steg Steg 1: Klicka på fliken 8220Data8221 och klicka sedan på 8220Data Analysis.8221 Steg 2: Klicka på 8220Göra genomsnittet8221 och klicka sedan på 8220OK.8221 Steg 3: Klicka på rutan 8220Input Range8221 och välj sedan dina data. Om du inkluderar kolumnrubriker, se till att du markerar etiketterna i första radrutan. Steg 4: Skriv ett intervall i lådan. Ett intervall är hur många tidigare poäng du vill att Excel ska använda för att beräkna det rörliga genomsnittet. Till exempel skulle 822058221 använda de tidigare 5 datapunkterna för att beräkna medelvärdet för varje efterföljande punkt. Ju lägre intervall desto närmare är ditt glidande medelvärde till din ursprungliga dataset. Steg 5: Klicka i rutan 8220Output Range8221 och välj ett område på arbetsbladet där du vill att resultatet ska visas. Eller, klicka på knappen 8220New worksheet8221. Steg 6: Markera rutan 8220Chart Output8221 om du vill se ett diagram över din dataset (om du glömmer att göra det kan du alltid gå tillbaka och lägga till det eller välja ett diagram från fliken 8220Insert8221.8221 Steg 7: Tryck på 8220OK .8221 Excel kommer att returnera resultaten i det område du angav i steg 6. Titta på videon eller läs stegen nedan: Provproblem: Beräkna treårigt glidande medelvärde i Excel för följande försäljningsdata: 2003 (33M), 2004 (22M), 2005 (36M), 2006 (34M), 2007 (43M), 2008 (39M), 2009 (41M), 2010 (36M), 2011 (45M), 2012 (56M), 2013 (64M). 1: Skriv in data i två kolumner i Excel. Den första kolumnen ska ha år och andra kolumnen kvantitativa data (i det här exemplet problemet, försäljnings siffrorna). Se till att det inte finns några tomma rader i din celldata. : Beräkna det första treårsgenomsnittet (2003-2005) för data. För det här provproblemet, skriv 8220 (B2B3B4) 38221 i cell D3. Beräkna det första genomsnittet. Steg 3: Dra kvadraten längst ner till höger d Egen att flytta formeln till alla celler i kolumnen. Detta beräknar medelvärden för efterföljande år (t ex 2004-2006, 2005-2007). Dra formeln. Steg 4: (Valfritt) Skapa en graf. Välj alla data i arbetsbladet. Klicka på fliken 8220Insert8221 och klicka sedan på 8220Scatter, 8221 och klicka sedan på 8220Scatter med släta linjer och markörer.8221 Ett diagram över ditt glidande medel visas på arbetsbladet. Kolla in vår YouTube-kanal för mer statistiks hjälp och tips. Flyttande medelvärde: Vad det är och hur man beräknar det var senast ändrat: 8 januari 2016 av Andale 22 tankar om ldquo Flyttande medelvärde: Vad det är och hur man beräknar det rdquo Detta är perfekt och enkelt att assimilera. Tack för arbetet Detta är mycket tydligt och informativt. Fråga: Hur räknar man med ett 4-årigt glidande medelvärde Vilket år skulle det 4-åriga glidande medelcentrumet på It centreras i slutet av det andra året (dvs. 31 december). Kan jag använda dig av medelinkomst för att prognostisera framtida intäkter som någon vet om centrerad medel, snälla berätta om någon vet. Här anges det att vi måste överväga 5 år för att få det medelvärde som ligger i centrum. Då då om resten år om vi vill få medelvärdet av 20118230 så har vi inga ytterligare värden efter 2012, hur skulle vi då beräkna det? Som du don8217t har mer info, det skulle vara omöjligt att beräkna 5 år MA för 2011. Du kan få ett tvåårigt glidande medel men. Hej Tack för videon. En sak är emellertid oklart. Hur man gör en prognos för de kommande månaderna Videon visar prognosen för månaderna för vilka data redan är tillgängliga. Hej, Rå, I8217m arbetar med att utöka artikeln för att inkludera prognoser. Processen är lite mer komplicerad än att använda tidigare data. Ta en titt på denna Duke University artikel, som förklarar det i djupet. Hälsningar, Stephanie tack för en tydlig förklaring. Hej Det gick inte att hitta länken till den föreslagna Duke University-artikeln. Request to post the link againCustomize Cell Data with Excels IF Function Ted French has over fifteen years experience teaching and writing about spreadsheet programs such as Excel, Google Spreadsheets and Lotus 1-2-3. Read more Updated August 23, 2016. IF Function Overview The IF function in Excel can be used to customize the content of specific cells depending on whether or not certain conditions in other worksheet cells that you specify are met. The basic form or syntax of Excel39s IF function is: What the function does is: Tests to see if a specified condition - the logic test - is true or false. If the condition is true, the function will carry out the action identified in the value if true argument If the condition is false, it will carry out the action specified in the value if false argument. The actions carried out can include executing a formula. inserting a text statement, or leaving a designated target cell blank. IF Function Step by Step Tutorial This tutorial uses the following IF function to calculate an annual deduction amount for employees based on their yearly salary. Inside the round brackets, the three arguments carry out the following tasks: The logic test checks to see if an employee39s salary is less than 30,000 If less than 30,000, the value if true argument multiplies the salary by the deduction rate of 6 If not less than 30,000, the value if false argument multiplies the salary by the deduction rate of 8 The following pages list the steps used to create and copy the IF function seen in the image above to calculate this deduction for multiple employees. Entering the Tutorial Data Enter the data into cells C1 to E5 of an Excel worksheet as seen in the image above. The only data not entered at this point is the IF function itself located in cell E6. Note: The instructions for copying the data do not include formatting steps for the worksheet. This will not interfere with completing the tutorial. Your worksheet may look different than the example shown, but the IF function will give you the same results. Ted French has over fifteen years experience teaching and writing about spreadsheet programs such as Excel, Google Spreadsheets and Lotus 1-2-3. Read more The IF Function Dialog Box Although it is possible to just type the IF function into cell E6 in the worksheet. many people find it easier to use the function39s dialog box to enter the function and its arguments. As shown in the image above, the dialog box makes it easy to enter the function39s arguments one at a time without having to worry about including the commas that act as separators between the arguments. In this tutorial, the same function is used several times, with the only difference being that some of the cell references are different depending on the location of the function. The first step is to enter the function into one cell in such a way that it can be copied correctly to other cells in the worksheet. Tutorial Steps Click on cell E6 to make it the active cell - this is where the IF function will be located Click on the Formulas tab of the ribbon Click on the Logical icon to open the function drop down list Click on IF in the list to bring up the IF function dialog box The data that will be entered into the three blank rows in the dialog box will form the IF function39s arguments . Tutorial Shortcut Option To continue with this tutorial, you can enter the arguments into the dialog box as shown in the image above and then jump to the last page that covers copying the IF function to rows 7 through 10 or follow through the next three pages which give detailed instructions and explanations for entering the three arguments. Ted French has over fifteen years experience teaching and writing about spreadsheet programs such as Excel, Google Spreadsheets and Lotus 1-2-3. Read more Entering the Logical Test Argument The logical test can be any value or expression that gives you a true or false answer. The data that can be used in this argument are numbers, cell references. the results of formulas. or text data. The logical test is always a comparison between two values, and Excel has six comparison operators that can be used to test whether the two values are equal or one value is less than or greater than the other. In this tutorial the comparison is between the value in cell E6 and the threshold salary of 30,000. Since the goal is to find out if E6 is less than 30,000, the Less Than operator 34 lt 34 is used. Tutorial Steps Click on the Logicaltest line in the dialog box Click on cell D6 to add this cell reference to the Logicaltest line. Type the less than key 34 lt 34 on the keyboard. Type 30000 after the less than symbol. Notera . Do not enter the dollar sign ( ) or a comma separator (. ) with the above amount. An Invalid error message will appear at the end of the Logicaltest line if either of these symbols are entered along with the data. The completed logical test should read: D6 lt 3000 Ted French has over fifteen years experience teaching and writing about spreadsheet programs such as Excel, Google Spreadsheets and Lotus 1-2-3. Read more Entering the Valueiftrue Argument The Valueiftrue argument tells the IF function what to do if the Logical Test is true. The Valueiftrue argument can be a formula. a block of text, a number, a cell reference. or the cell can be left blank. In this tutorial, if the employee39s annual salary located in cell D6 is less than 30,000 the IF function is to use a formula to multiply the salary by the deduction rate of 6, located in cell D3. Relative vs Absolute Cell References Once completed, the intention is to copy the IF function in E6 to cells E7 through to E10 to find out the deduction rate for the the other employees listed. Normally, when a function is copied to other cells, the cell references in the function change to reflect the function39s new location. These are called relative cell references and they normally make it easier to use the same function in multiple locations. Occasional, however, having cell references change when a function is copied will result in errors. To prevent such errors, the cell references can be made Absolute which stops them from changing when they are copied. Absolute cell references are created by adding dollar signs around a regular cell reference, such as D3. Adding the dollar signs is easily done by pressing the F4 key on the keyboard after the cell reference has been entered into a worksheet cell or into a function dialog box. Absolute Cell References For this tutorial, the two cell references that must remain the same for all instances of the IF function are D3 and D4 - the cells containing the deduction rates. Therefore, for this step, when the cell reference D3 is entered into the Valueiftrue line of the dialog box it will be as an absolute cell reference D3. Tutorial Steps Click on the Valueiftrue line in the dialog box. Click on cell D3 in the worksheet to add this cell reference to the Valueiftrue line. Press the F4 key on the keyboard to make E3 an absolute cell reference ( D3 ). Press the asterisk ( ) key on the keyboard. The asterisk is the multiplication symbol in Excel. Click on cell D6 to add this cell reference to the Valueiftrue line. Note: D6 is not entered as an absolute cell reference as it needs to change when the function is copied The completed Valueiftrue line should read: D3 D6 . Ted French has over fifteen years experience teaching and writing about spreadsheet programs such as Excel, Google Spreadsheets and Lotus 1-2-3. Read more Entering the Valueiffalse Argument The Valueiffalse argument tells the IF function what to do if the Logical Test is false. The Valueiffalse argument can be a formula. a block of text, a value. a cell reference. or the cell can be left blank. In this tutorial, if the employee39s annual salary located in cell D6 is not less than 30,000, the IF function is to use a formula to multiply the salary by the deduction rate of 8 - located in cell D4. As in the preceding step, to prevent errors when copying the completed IF function, the deduction rate in D4 is entered as an absolute cell reference ( D4 ). Tutorial Steps Click on the Valueiffalse line in the dialog box Click on cell D4 to add this cell reference to the Valueiffalse line Press the F4 key on the keyboard to make D4 an absolute cell reference ( D4 ). Press the asterisk ( ) key on the keyboard. The asterisk is the multiplication symbol in Excel. Click on cell D6 to add this cell reference to the Valueiffalse line. Note: D6 is not entered as an absolute cell reference as it needs to change when the function is copied The completed Valueiffalse line should read: D4 D6 . Click OK to close the dialog box and enter the completed IF function into cell E6. The value of 3,678.96 should appear in cell E6. Since B. Smith earns more than 30,000 per year, the IF function uses the formula 45,987 8 to calculate his annual deduction. When you click on cell E6, the complete function 61 IF ( D6lt3000,D3D6,D4D6) appears in the formula bar above the worksheet If steps in this tutorial have been followed, your worksheet should contain the same IF function seen in the image on page 1 . Ted French has over fifteen years experience teaching and writing about spreadsheet programs such as Excel, Google Spreadsheets and Lotus 1-2-3. Read more Copying the IF function using the fill handle To complete the worksheet. we need to add the IF function to cells E7 to E10. Since our data is laid out in a regular pattern, we can copy the IF function in cell E6 to the other four cells. As the function is copied, Excel will update the relative cell references to reflect the function39s new location while keeping the absolute cell reference the same. To copy down our function we will use the Fill Handle . Tutorial Steps Click on cell E6 to make it the active cell . Place the mouse pointer over the black square in the bottom right corner. The pointer will change to a plus sign 34 43 34. Click the left mouse button and drag the fill handle down to cell F10. Release the mouse button. Cells E7 to E10 will be filled with the results of the IF function.
Comments
Post a Comment