Etikettarkiv: #data

Evigt väntande…

När man håller på att syssla med Big Data så tar det ett tag att gå igenom miljarder av rader för att kunna processera den informationen man behöver och för att kunna få fram träningsexempel, metrics eller liknande.

På Spotify så är detta just situationen jag sitter i. Jag måste vänta upp till en timme för att generera träningsexempel, och mycket, mycket längre för att kunna träna en modell som kan göra awesome predictions.

För tillfället så väntar jag på att mitt jobb ska bli klart på big data klustret så att jag kan fortsätta jobba. Det gäller att vara försiktig här med, varenda kodrad kostar både tid och pengar, så när man har något fel och behöver generera om all data så behöver det nödvändigtvis inte vara kört men man förlorar rätt mycket tid på sina misstag. Inget man behöver tänka på när man kodar med datasets som är runt 10k rader, här snackar vi miljarder 😉

Läs mer om Datateknikprogrammet!

Idag vill jag länka lite intressant information om datateknikprogrammet! Det är ju snart dags att välja utbildning, och jag vill ju att du ska välja rätt 😉

Visste du att du blir riktigt duktig på datorer och allt däremellan efter? Har möjlighet att välja rääättt mycket fria poäng och nästan vilken master som helst? Välj ett civilingenjörsprogram, välj rätt, välj data! 😉

Klicka på bilden för att läsa mer!

Mål, etik och prosam!

Tja läsare!

Som ni tidigare vet, så måste alla dataloger, oavsett kandidat eller masterprogram, läsa en kurs som kallas för programsammanhållande kurs inom datalogi på 6 respektive 2 poäng.

Jag har faktiskt missat rätt mycket i år, och försöker att pussla ihop några reflektioner jag har missat. Det är inte alltid lätt, och ibland måste man organisera informationen såhär! #datalog

Screen Shot 2016-04-23 at 00.00.13

CSC 469 Current Topics in Computer Systems: Distributed Systems

JPEG image-D4D5488DB22D-1

Current Topics in Computer Systems: Distributed Systems

Yaas! För närvarande så sitter jag på föreläsning för denna kurs. Kursen handlar om distribuerade system, precis som titeln säger och har starka kopplingar med operativsystem, nätverk, systems programming och parallella beräkningar – komiskt nog så har jag inte läst majoriteten av kurserna jag radade upp, så denna kurs kommer nog bli en riktig utmaning!
Läraren verkar vara vettig och det verkar som att det kommer att bli en rolig kurs! 🙂

Vi kommer att få lära oss följande:

  • Designa, implementera och testa distribuerade system
  • Lära oss om MapReduce/Hadoop
  • Implementera ett P2P system såsom uTorrent

Vill du veta mer om denna kurs? KTH Erbjuder en liknande kurs, nämligen ID2201 Distributed Systems som du kan kika på! Med en tenta på 5hp och labbar på 1hp så skulle jag nog inte ha valfritt valt den kursen. #maximerakodning #slutamedtentor #bortmedtentor #projectlife

Och jag är taggad! Let’s do this!