Hva er Power Query? En introduksjon for nybegynnere
Å kunne importere, behandle, analysere og trekke verdifull innsikt fra dataene våre er essensielt for enhver som jobber ofte i Microsoft Excel og ønsker å lykkes med data analyse, data science, men også business intelligence. Power Query er en del av Excel som gir oss muligheten til å hente data fra forskjellige kilder (som .txt og .csv filer) og transformere dem etter behov, noe som gir oss en lett håndterlig Excel tabell. Du må da bare sette opp disse stegene en gang. Hver gang dataene dine endres, vil også dataene i Excel tabellen din endres. En helt ny måte å jobbe med eksterne datakilder!
Det er verdt å nevne at Power Query er tilgjengelig i Excel 2010 og senere. Men, det er i Excel 2016 og senere versjoner at det virkelig har blitt en integrert del av Excel-brukeropplevelsen, og har fått et eget dedikert felt i båndet.
I denne bloggposten vil vi føre deg gjennom hvordan Power Query kan brukes i praksis med et enkelt eksempel. Vi skal importere og behandle en CSV-fil med salgsdata fra en frukt butikk og samtidig lære noe av de grunnleggende konseptene du kan gjøre i Power Query. Målet er å gi deg en lett forståelig innføring uten å overvelde deg med for mye informasjon.
Det er altså viktig å være klar over at selv om vi i dette innlegget bare vil dekke rundt 10% av Power Query sine muligheter, så er det mye mer utover det du kan gjøre med Power Query. Fra det å håndtere store mengder data, automatisering av oppgaver, til avanserte transformasjoner.
Hvis du etter å ha lest denne artikkelen føler behov for mer avansert Excel konsulent hjelp, er du velkommen til å kontakte oss. Vi står alltid klare til å hjelpe deg å utnytte Excel og Power Query til det fulle!
Åpne Power Query og velge CSV-fil
For å bruke Power Query, må vi først finne datakilden vår. I dette tilfellet, kommer våre data fra en CSV-fil. Her ser du et en liten del av csv filen som vi skal importere og transformere (legg merke til hvor dårlig dataene her er strukturert, med ubrukelige header og footer, kategori og produkt slått sammen til en kolonne, rader uten data, osv.). Du kan last4e ned csv filen og Excel arket helt nederst i innlegget.
Butikk: Lille Frukt Paradis AS Start dato: 10.07.2023 Slutt dato: 16.07.2023 =============================== Kategori/Produkt;Dato;Enhetpris;SolgtKg Frukt-Eple;10.07.2023;29;48 Frukt-Banan;10.07.2023;24;58 Frukt-Melon;10.07.2023;15;40 Bær-Blåbær;10.07.2023;119;20 Bær-Jordbær;10.07.2023;99;24 Bær-Bringebær;10.07.2023;149;16 =============================== Frukt-Eple;11.07.2023;29;44 Frukt-Banan;11.07.2023;24;60 ... =============================== Frukt-Eple;16.07.2023;29;56 Frukt-Banan;16.07.2023;24;60 Frukt-Melon;16.07.2023;15;40 Bær-Blåbær;16.07.2023;119;18 Bær-Jordbær;16.07.2023;99;28 Bær-Bringebær;16.07.2023;149;12 =============================== Utskriftsdato 17.07.2023 20:16
Først åpner vi Power Query ved å klikke på "Data" i Excel-båndet, deretter "Hent data", og til slutt "Start Power Query-redigering".
Selv om det er mulig å gå direkte til "Fra fil" i menyen, vil vi i dette eksempelet vise hvordan man velger en kilde når man allerede er inne i Power Query-redigeringsmiljøet.
Når Power Query-redigeringsvinduet åpner seg, vil du se en rekke alternativer for å hente data fra forskjellige kilder. For å laste inn vår CSV-fil, klikker vi på "Ny kilde" under "Hjem" fanen. Deretter velger vi "Fil > Fra CSV".
Etter at du har funnet og valgt CSV-filen du ønsker å bruke, klikk "Åpne". Når filen er lastet inn, vises en forhåndsvisning av dataene i CSV-filen. Siden dataene våre er skilt med semikolon, velger vi "Semikolon" som skilletegn. Hvis alt ser greit ut i forhåndsvisningen, klikker vi på "OK".
Det er også viktig å merke seg at Power Query automatisk prøver å gjenkjenne datatypene i CSV-filen. Dette virker som en nyttig funksjon, men i noen tilfeller vil du kanskje deaktivere denne funksjonen. For å gjøre dette, kan du klikke på "x" ved siden av "Endret datatype" i "Brukte trinn"-listen.
Rydd opp: Fjern unødvendige rader og promoter overskrifter
Når du importerer data, kan det hende at det er unødvendige rader i begynnelsen eller slutten av datasettet ditt. I vårt tilfelle inneholder CSV-filen vår fem unødvendige rader på toppen og to rader på bunnen. For å rydde opp i dette, bruker vi Power Querys "Fjern rader"-funksjon.
Vi begynner med å fjerne de øverste radene. Dette gjøres ved å klikke på "Hjem" i menyen, deretter "Fjern rader", og til slutt "Fjern de øverste radene". Etter å ha klikket på "Fjern de øverste radene", vil en dialogboks dukke opp der vi taster inn antallet rader vi ønsker å fjerne - i dette tilfellet, 5.
Neste steg er å fjerne de to nederste radene. Dette gjøres på samme måte, men denne gangen velger vi "Fjern nederste rader" i stedet. I dialogboksen som dukker opp, taster vi inn 2, ettersom vi har to unødvendige rader under dataene våres.
Etter at vi har fjernet de unødvendige radene, er det på tide å promotere raden med overskrifter til å være kolonneoverskrifter i datasettet vårt. Dette gjøres enkelt ved å klikke på "Bruk første rad som overskrifter" i "Hjem"-menyen.
Nå ser datasettet vårt mye mer organisert og forståelig ut.
Og det beste av alt? Hvert steg vi har tatt, blir nøye registrert i "Brukte trinn"-listen på høyre side av redigeringsvinduet. Dette gjør det enkelt å se og endre handlingene vi har tatt.
Når vi arbeider med rådata, er det vanlig å støte på uønsket eller ugyldig informasjon. I vårt eksempel ser vi at det er en del rader som inneholder ====================
eller tom informasjon ;;;
. Disse radene tilfører skaper alt mulig av hodebry i datasettet vårt og vi vil gjerne fjerne dem.
Hvis vi for eksempel velger kolonnen "Dato" og klikker på "pilen" for å åpne filteret, vil vi se noe data som er "(null)". Dette betyr at det er rader i denne kolonnen som ikke inneholder noen data. Ved å fjerne krysset for "(null)", vil vi effektivt fjerne alle rader som har tomme datoer.
Av og til kan det være at du ser rader som inneholder ordet "error". Dette indikerer et problem med dataene i denne raden. For å bli kvitt disse radene, kan du bruke funksjonen "Fjern rader" og deretter "Fjern feil". På denne måten sørger vi for at datasettet vårt kun inneholder gyldige og korrekte data.
Håndtering av datatyper i Power Query
Når vi jobber med Power Query, er det viktig å velge riktig datatype for dataene våre. Datatypen forteller programmet hvordan det skal tolke og behandle dataene vi gir det. I vårt tilfelle vil vi fokusere på kolonnene "Dato", "Enhetspris" og "SolgtKg".
For å endre datatypen til en kolonne, kan du klikke på det lille symbolet som vises i kolonnetitelen. Dette vil åpne en rullegardinmeny hvor du kan velge blant forskjellige datatyper.
I vårt datasett ser "Enhetspris" og "SolgtKg" ut til å være heltall, så det kan vi sette som heltall. Men for å fremtidssikre datasettet vårt, kan det være lurt å velge desimaltall som datatype. På denne måten, hvis vi i fremtiden får data med desimaltall, vil datasettet vårt allerede være klart til å håndtere dette.
Det er verdt å merke seg at hvis vi velger feil datatype, vil vi sannsynligvis merke det når vi prøver å analysere dataene våre. En feil datatype vil vanligvis (men ikke alltid!) resultere i en feilmelding.
Til slutt, det er viktig å huske at hvis du jobber med data som har forskjellige, internasjonale format (f.eks. amerikansk dato eller desimaltall med "." som skilletegn), kan du bruke funksjonen "Med nasjonale innstillinger" for å konvertere dataene til en godkjent type.
Enkel kolonneoppsplitting i Power Query
Når vi arbeider med datasett i Power Query, er det ikke uvanlig å støte på kolonner der flere forskjellige typer data er slått sammen, som i vårt tilfelle der vi har Kategori/Produkt
-kolonnen. Men det er viktig å adskille disse dataene for å lette analysen.
For å dele opp en kolonne, kan vi markere den aktuelle kolonnen, i dette tilfellet Kategori/Produkt
. Deretter går vi til "Del kolonne" og velger "Med skilletegn". Her skal vi bruke -
som skilletegn, ettersom det er dette tegnet som er brukt for å skille kategori og produkt i vårt datasett.
Når kolonnen er delt opp, får vi to nye kolonner. Vi kan gi disse kolonnene mer fornuftige navn for å gjøre det lettere å forstå dataene. Dette kan gjøres ved å dobbeltklikke på kolonnetitlene og deretter skrive inn de nye navnene.
Når vi analyserer f.eks. salgsdata, kan det være nyttig å kunne beregne totalt salg eller omsetning per produkt. Med Power Query kan vi gjøre dette ved å opprette en kalkulert kolonne. En kalkulert kolonne bruker en formel som bruker verdier fra andre kolonner for å beregne en ny verdi.
I vårt tilfelle ønsker vi å beregne omsetning per produkt. Vi vil gjøre dette ved å multiplisere Enhetspris
med SolgtKg
. Først markerer vi disse to kolonnene. Deretter går vi til "Legg til kolonne" i menyen, og velger "Standard" > "Multiplikasjon". Dette vil generere en ny kolonne som viser produktet av de to utvalgte kolonnene.
Den nye kolonnen blir automatisk navngitt "Multiplikasjon". Men for at dette skal være mer meningsfylt for oss, vil vi endre navnet til "Omsetning". Dette kan gjøres ved å dobbeltklikke på kolonnenavnet og skrive inn det nye navnet.
Effektiv dataanalyse: Hvordan gruppere data i Power Query
For å få en mer konsolidert oversikt over salget vårt, kan vi bruke grupperingsfunksjonen i Power Query. Gruppering kan hjelpe oss med å samle data basert på en bestemt kolonne. I vårt tilfelle ønsker vi å se total omsetning per produkt.
For å gjøre dette, starter vi med å markere Produkt
kolonnen. Vi høyreklikker deretter på den og velger "Grupper etter".
I dialogboksen som dukker opp, vil Produkt
kolonnen allerede være valgt. Neste trinn er å velge navnet på den nye, grupperte kolonnen, som vi kaller "Total omsetning". Operasjonen vi velger er "Sum", fordi vi ønsker å oppsummere omsetning per produkt. Kolonnen vi velger til høyre er derfor "Omsetning". Vi bekrefter våre valg ved å klikke "Ok".
Nå vil vi få en ny liste som viser hvert av de seks produktene med total omsetning for alle dager.
Det som er veldig flott: Når dataene dine i csv filen endrer seg, så klikker du bare på "Oppdater" i Excel og import samt oppsummering vil oppdatere seg også. Du trenger altså ikke å gå gjennom alle disse stegene hver gang du får nye data. Det kan spare deg mengder med tid!
Tilbake til Excel: Laste inn data fra Power Query
Etter å ha gjennomført alle stegene i Power Query, er det på tide å laste dataene tilbake til Excel. Vi avslutter håndteringen i Power Query ved å klikke på "Lukk og last inn" > "Lukk og last inn til".
En dialogboks vil dukke opp, og her velger vi "Tabell" og "Eksisterende regneark". Ved å bekrefte disse valgene, oppretter vi en tabell i regnearket.
Denne tabellen vil oppdateres automatisk når vi trykker på "Oppdater" i menyen "Tabellutforming". Dette betyr at vi bare trenger et enkelt tastetrykk for å få en oppdatert analyse når dataene endres.
Veien videre: Lær deg mer om mulighetene i Power Query
Etter å ha fulgt denne veiledningen, er du nå i stand til å gjennomføre enkle dataimporter og transformasjoner i Power Query. Du har lært å åpne Power Query, velge en datakilde, fjerne unødvendig informasjon, behandle feil og ugyldig data, velge riktig datatyper, dele opp kolonner, lage kalkulerte kolonner, gruppere data, og til slutt laste bearbeidede data tilbake til Excel. Dette er grunnleggende ferdigheter som vil hjelpe deg med mange oppgaver innen datahåndtering og analyse.
Men det er viktig å merke seg at vi bare har skrapet litt på overflaten og at Power Query har mye mer å by på. Power Query er et kraftig verktøy som kan utføre mange avanserte transformasjoner og analyser. Her er noen eksempler på hva du kan gjøre i Power Query som vi ikke har dekket i denne artikkelen:
- Koble sammen flere datakilder: Du kan importere data fra flere kilder og kombinere dem i Power Query.
- Utføre avanserte data-transformasjoner: Du kan for eksempel pivotere og unpivotere tabeller, fusjonere tabeller, og utføre mange andre avanserte transformasjoner.
- Skape tilpassede funksjoner: Du kan lage dine egne funksjoner for å utføre bestemte operasjoner på dataene dine.
- Bruke M-forespørselsspråket: Power Query bruker M-forespørselsspråket, og du kan skrive dine egne M-forespørsler for å gjøre komplekse data-transformasjoner og analyser.
- Behandle store mengder data: Power Query kan håndtere store datamengder, noe som gjør det til et flott verktøy for store datadrevne prosjekter.
- Og mye mer!
Vi håper at vi har klart å vekke begeistringen for Power Query. Med litt øvelse vil du finne at Power Query kan være en uvurderlig ressurs for dine dataanalyseprosjekter. Og trenger du konsulenthjelp, så er vi bare en telefonsamtale eller epost unna.
Last ned eksemplet her:
Dersom du tester eksemplet - vær oppmerksom på at du må tilpasse filstien til csv filen! Det gjør du i Power Query > Brukte trinn > Kilde. Der kan du endre filstien.
Ønsker du hjelp med dine Power Query utfordringer?
Excellence Utvikling hjelper bedrifter med alle oppgaver rundt Microsoft Excel og Power Query, blant annet utvikling av kalkyler, dashboards, makroer og selvsagt proff håndtering av store datamengder. Ta gjerne kontakt med alle typer spørsmål eller finn ut mer om våre Excel konsulent tjenester. Lik gjerne siden på Facebook, så får du alle nyheter.