Original thread by Nilta (@asanilta)
Karena bentar lagi mau berangkat belajar Social Data Science di Oxford, aku mulai mendalami reading listnya dan ternyata isinya BANYAK BGTT terus menarik semua!! :’)
Btw aku abis kumpulin beberapa buku2/artikel2nya yg bisa dibaca gratis, kalo ada yg tertarik boleh baca & RT~ ?
Berhubung dari dulu banyak yang nanya2 karena tertarik juga sama bidang Social Data Science, aku sekalian jelasin dikit ya kurang lebih bakal belajar apa di SDS. Ini masih mengacu ke kurikulum & reading list taun lalu, bisa berubah2 tapi intinya miriip. Btw maaf threadnya panjang
Sedikit intro dulu, SDS ini jurusan yg mayan baru dari departemen Oxford Internet Institute. Selain SDS juga ada jurusan “Social Science of the Internet” yang lebih ke arah social science research, sementara SDS ini lebih ke pengaplikasian data science u/ social science questions

Semua yg di thread ini sumbernya dari web OII langsung: https://www.oii.ox.ac.uk/study/msc-in-social-data-science/ tinggal lihat2 di bagian Structure > klik matkulnya > klik View Now di bawah Reading List (tapi ga semua buku/artikelnya tersedia gratis)
Btw SDS jg ga di oxford doang kok ?
Kompilasi untuk orang2 di replies yg tertarik juga ?
Ini ada yg lebih ke data sciencenya ada jg yg lebih ke social sciencenya, baca2 aja buat cari yg cocok yaa
*SDS = Social Data Science
– MSc Applied SDS at LSE
– MSc SDS at University of Copenhagen
– MSc SDS at Oxford
— QRT https://twitter.com/asanilta/status/1404410198379294721
Kita mulai dari matkul wajib yang lebih teknis ke arah data sciencenya ya.
Fundamentals of SDS in Python -> kelas yg utamanya praktikum, tujuannya belajar programming dengan Python untuk data science
Buat yang baru belajar Python, sebenernya disaranin buku Python Crash Course..
…tapi ini ga available secara gratis. Alternatifnya bisa baca guide Introducing Python yang ditulis langsung oleh Programme Director aku (DM kalo mau linknya)
Bisa juga nanti ikut kursus Python gratis dari @pacmannai ya ?
Sedikit gambaran bagi kalian yang ingin mengambil Free Course!
?????



— QRT https://twitter.com/pacmannai/status/1548177682889728003
Lanjutannya, ada jg buku2 ini yg bisa dibaca lengkap gratis & legal di websitenya masing2:
Python for Data Analysis
https://wesmckinney.com/book/
Bit by Bit: Social Research in the Digital Age
https://www.bitbybitbook.com/en/1st-ed/preface/
Natural Language Processing with Python
https://www.nltk.org/book/




Ada juga buku “Mining the Social Web” yg ebooknya gak tersedia gratis (boleh DM aku ya kalo tertarik baca) tapi dia ada resourcesnya di Github berisi notebook & kode buat mining twitter, ig, fb, linkedin, dll yg bisa dijadiin contoh.
https://github.com/mikhailklassen/Mining-the-Social-Web-3rd-Edition
Selanjutnya,
Data Analytics at Scale -> belajar efisiensi analisis data dlm jumlah besar, termasuk parallel & distributed programming dan data storage
Ini kita spesifiknya bakal belajar pake UNIX, Docker, MapReduce, Spark, Cython, library multiprocessing, NoSQL, dll
Buku utamanya
“Python high performance: build robust application by implementing concurrent and distributed processing techniques” gak gratis kecuali dari trial O’Reilly/PacktPub (atau DM)
Ada jg “Human-in-the-Loop Machine Learning”, bisa baca full di
https://www.manning.com/books/human-in-the-loop-machine-learning


Dan tentu yg DS banget nih,
Machine Learning -> belajar supervised dan unsupervised machine learning, dari regression sampai neural networks
Buku-bukunya:
The elements of statistical learning: data mining, inference, and prediction
https://hastie.su.domains/ElemStatLearn/

Mathematics for Machine Learning
https://mml-book.github.io/
Machine Learning: A Probabilistic Perspective (DM buat yg Book 0, tapi bisa download lanjutannya yg Book 1 & Book 2 di https://probml.github.io/pml-book/)
Deep Learning
https://www.deeplearningbook.org/



Intermezzo dulu sedikit ya.
Jujur pelajaran2 di atas dan hampir semua bukunya itu teknis banget dan menurutku cukup berat kalo belajar dari 0 sendirian, apalagi dia pakai bahasa Inggris dan isinya cukup njelimet. Jadi buat yang cenderung newbie ke DS baiknya gimana dulu?


Aku rekomendasiin belajar Data Science dengan cara slow-paced learning (jangan diburu2, belajar ini biasanya min. setaun), dengan bantuan dan dukungan dari komunitas dan ahli-ahlinya. Lebih baik lagi kalo bisa ikut kelas dan ngikutin kurikulum yang in-depth dalam teori & praktik.
Contoh slow-paced learning dengan kurikulum in-depth kayak gimana sih?
Kalian bisa cek program @pacmannai buat belajar DS full (dari programming sampai deep learning) selama 12-14 bulan dan daftar dengan ‼️DISKON‼️ pakai kode asa_nilta di https://rebrand.ly/asa_nilta
#SeekMastery #ad
Kenapa aku rekomendasiin @pacmannai? Aku kenal langsung sama orang2 yg ngajar/ngasistensi di sana dan jg orang2 yg pernah belajar di sana, dan dari keahlian mereka I can honestly say that I think Pacmann adalah program pembelajaran DS/BI yang terbaik di Indonesia saat ini.
Lanjut lagi yok~
Applied Analytical Statistics -> belajar tools & techniques yg digunakan social scientists u/ analisis quantitative data
Ini pakai buku “Applied Regression Analysis & Generalized Linear Models” (kalo mau DM ya) dan “Python for Data Analysis” (di atas)

Mulai masuk ke yg bagian sosial2nya…
Frontiers of Social Data Science -> di sini kita mendiskusikan peran dan masa depan data dalam society, misal hubungan data dengan inovasi, privacy, learning, medicine, dan berbagai aspek lainnya dlm kehidupan sosial
Foundations of Social Data Science -> tiap minggu diskusi dan debat tentang topik2 yg berhubungan dengan social data science, misal apakah big data bisa empower atau manipulate markets and consumers, atau tentang algorithmic fairness and bias, dll.
Selain ini ada juga kelas2 lainnya seperti Foundations of Visualization, Digital Era Government and Politics, Human and Data Intelligence, Internet Economics, Interpreting Social Networks, Introduction to NLP for Social Sciences, dll lengkapnya ada di https://www.oii.ox.ac.uk/study/msc-in-social-data-science/
Sayangnya buku2 yg non-technical pada ga ada versi online gratisnya jadi aku kumpulin paper2/artikel2 dari reading listnya yaa, ini juga aku udah pilihin dan cariin linknya buat baca full gratis kok (btw lupa ini pada dari matkul yg mana aja aku gabungin semua)
The Algorithmic Rise of the “Alt-Right”
https://journals.sagepub.com/doi/full/10.1177/1536504218766547
The Chinese approach to artificial intelligence: an analysis of policy, ethics, and regulation
https://link.springer.com/article/10.1007/s00146-020-00992-2
Algorithmic Colonization of Africa
https://script-ed.org/article/algorithmic-colonization-of-africa/
New data, old tensions: Big data, personalized learning, and the challenges of progressive education
https://www.researchgate.net/publication/320257837_New_data_old_tensions_Big_data_personalized_learning_and_the_challenges_of_progressive_education
Big other: Surveillance Capitalism and the Prospects of an Information Civilization
https://journals.sagepub.com/doi/10.1057/jit.2015.5
Machine Bias
https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing
Bias Preservation in Machine Learning: The Legality of Fairness Metrics Under EU Non-Discrimination Law
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3792772
On the (im)possibility of fairness
https://arxiv.org/abs/1609.07236
Algorithmic Discrimination Is an Information Problem
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3387801#maincontent
Why The Future Doesn’t Need Us
https://www.wired.com/2000/04/joy-2/
How Should We Do the History of Big Data?
https://journals.sagepub.com/doi/10.1177/2053951716646135
Big Data from the South(s): Beyond Data Universalism
https://journals.sagepub.com/doi/full/10.1177/1527476419837739
The Global Commons of Data
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3263466
Privacy Law: Positive Theory and Normative Practice
https://scholarship.law.upenn.edu/faculty_scholarship/556/
Social Bias Frames: Reasoning about Social and Power Implications of Language
https://arxiv.org/abs/1911.03891
The Consequences of the Internet for Politics
https://www.annualreviews.org/doi/10.1146/annurev-polisci-030810-110815
How the machine ‘thinks’: Understanding opacity in machine learning algorithms
https://journals.sagepub.com/doi/full/10.1177/2053951715622512
Principles alone cannot guarantee ethical AI
https://www.researchgate.net/publication/337015694_Principles_alone_cannot_guarantee_ethical_AI
Toward a Reputation State: The Social Credit System Project of China
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3193577
Why Are Half of Latin Americans Not Online? A Four-Country Study of Reasons for Internet Non-Adoption
https://ijoc.org/index.php/ijoc/article/view/6287/2114
Digital inequalities and why they matter
https://www.researchgate.net/publication/276880312_Digital_inequalities_and_why_they_matter
Leveraging mobile phones to attain sustainable development
https://www.pnas.org/doi/10.1073/pnas.1909326117
Mapping Twitter Topic Networks: From Polarized Crowds to Community Clusters
https://www.pewresearch.org/internet/2014/02/20/mapping-twitter-topic-networks-from-polarized-crowds-to-community-clusters/
Visualizing social networks
https://www.cmu.edu/joss/content/articles/volume1/Freeman.html
Visual analysis for everyone
https://cdnlarge.tableausoftware.com/sites/default/files/whitepapers/visual_analysis_for-everyone.pdf
Tadinya mau lanjut karena listnya masih banyak tapi tiba-tiba web OII-nya kok ga bisa dibuka ya… Nanti deh?
Anyway makasih yang udah baca sampe sini, semoga thread ini bisa men-“demistify” bidang Social Data Science dan bisa jadi sedikit referensi buat yang tertarik belajar!!
Sblm lanjut tar malem maaaaf bgt mau tweet ulang ini karena tadi di beberapa orang munculnya “Tweet is unavailable” HIKSSS. Sekali lagi kalo ada yang mau daftar programnya Pacmann jangan lupa pake kode referral aku yaitu ‼️ asa_nilta ‼️ di https://pacmann.io/?utm_source=kol&utm_medium=referral&utm_term=asa_nilta ok makasiih ??