Transcript for:
Prisoner's Dilemma dan Aplikasi Game Theory

bayangin lu dan gua habis nyuri barang terus kita ditangkap sama polisi tapi karena barang buktinya itu kurang kuat polisi butuh Pengakuan dari lu ataupun gua dan yang mereka lakuin adalah naruh kita di ruangan yang berbeda lalu kita dikasih pilihan kalau misalnya di antara kita enggak ada yang ngaku dan kita saling ngejagain kita bakal dipenjara 1 bulan karena buktinya itu kurang tapi kalau misalnya gua khianatin lu dan gua ngasih bukti-bukti yang kuat padahal lu tetap diam lu bakal ditahan 12 bulan dan gua bakalan bebas gara-gara polisi Berterima kasih sama gua gua mau ng-espeel dosa-dosanya lu begitu juga sebaliknya ya kalau misalnya lu khianatin gua dan gua yang game aja gua bakalan ditahan 12 bulan dan lu yang bebas tapi kalau misalnya kita berdua sama-sama saling ngekhianatin satu sama lain kita berdua bakal masuk penjara selama 8 bulan pilihan mana yang lu bakal ambil kalau misalnya lu ada di dalam situasi kayak gini secara logika pilihan yang terbaik adalah ya kita berdua saling kerja sama dong masuk akal kan gua masuk 1 bulan lu masuknya juga 1 bulan tapi realitanya kemungkinan besar orang itu bakal mikir apa yang terbaik untuk diri mereka sendiri dan di masing-masing case kalau misalnya gua memilih untuk diam aja Pilihan lu itu khianatin gua dan lu bakalan bebas atau lu milih buat diam juga tapi lu bakalan masuk penjara 1 bulan sebaliknya kalau misalnya gua jahat dan gua khianatin lo buat lo juga akan lebih baik buat khianatin gua soalnya lu bakal dipenjara 8 bulan sedangkan kalau misalnya lu diam aja lu bakalan masuk 12 bulan jadi walaupun sebenarnya kalau misalnya kita mau kerja sama dan koperatif buat diam aja adalah pilihan dengan hasil yang terbaik masing-masing dipenjara 1 bulan kemungkinan terbesar yang akan terjadi adalah kita itu bakal saling mengkhianati satu sama lain Dan kita berdua di penjara 8 bulan ini salah satu konsep yang paling populer di game theory namanya itu prisoners dilema Dan konsep ini bukan berlaku cuman buat masalah penjahat yang ditangkap sama polisi aja ya tapi ini ada kaitannya sama kehidupan cara kita investasi strategi geopolitik maupun International relations dan mayoritas video ini adopsi dari veritasium tentang game theory saking pentingnya filosofi dan pelajaran yang gua dapat gua bakal menjermahin ke teman-teman prinsip dan pelajarannya let's go game theory bisa diaplikasikan juga saat Perang Dingin Antara Amerika dan Soviet Union keduanya ngembangin nuklir besar-besaran sampai puluhan ribu senjata nuklir lebih dari cukup buat saling urin satu sama lain berkali-kali tapi gara-gara kedua negara ini punya banyak senjata nuklir enggak ada satu pun yang bisa gunain karena mereka tahu sekali yang satu itu nembak pakai nuklir satu lagi pasti ngebalas ini sama aja kayak bunuh diri akhirnya kedua negara Ini ngabisin sekitar 10 triliun dolar untuk ngembangin senjata nuklir yang sia-sia enggak ada yang pakai padahal bakal lebih baik lagi kalau misalnya mereka sepakat dari awal untuk sama-sama tidak mengembangkan teknologi ini mendingan duitnya itu di dipakai buat hal-hal yang lain tapi gara-gara Amerika dan Soviet Union ini bertindak demi kepentingan mereka masing-masing akhirnya mereka berakhir dalam situasi di mana hasilnya itu malah lebih jelek buat dua-duanya nah balik lagi ke case gua sama lo yang di penjara tadi di kehidupan nyata realitanya gua sama lo itu enggak bakal main prisoners di lama ini cuma sekali bisa aja kita mainnya itu berkali-kali soalnya kalau misalnya kita mau nyuri barang lagi kita bakal harus kerja sama lagi di organisasi kriminal kita jadi otomatis ini merubah game-nya kalau misalnya gua tahu mengkhianati lu ini mungkin menguntungkan sekali tapi kapan-kapan kalau misalnya ketangkap lagi lu udah tahu bahwa gua dulu itu pernah jahat sama lu lu bisa pakai informasi itu buat mikir dua kali kalau misalnya lu mau kongkikong sama gua ini yang bikin Robert axelrot seorang political Scientist penasaran dan mau nyari tahu lebih dalam dia bikin kompetisi dan orang itu bisa ikut turnamen dengan ngasih program alias strategi yang bakal ngelawan satu sama lain setiap strategi akan berhadapan dengan setiap strategi lainnya dan melawan kopi dari strategi itu sendiri dan setiap pertarungan akan berlangsung selama 200 putaran tujuan dari turnamen ini adalah untuk memenangkan poin sebanyak mungkin selama 200 putaran Jadi bukan dilihat dari satu ronde aja secara total Acel road nerima 14 strategi yang berbeda dan dia nambahin strategi ke-15 yang disebut sebagai random yang artinya berkooperasi atau Kongkalikong dan nge-backstep atau nusuk dari belakang secara acak dengan rasio 1 banding 1 salah satu strateginya adalah freedman ini dimulai dari koperatif tapi kalau misalnya lawannya itu nge-backstep sekali aja freedman ini bakal nge-backstep selamanya Jadi freedman ini ciri-ciri yang kagak ada ampun Lalu ada lagi jos itu dimulai dengan koperatif dan dia juga ngikutin apa yang diperlakukan Lawannya pada langkah terakhir ditambah lagi sekitar 10%-nya jos ini nge-backstep ada juga strategi yang agak rumit namanya grass camp grass camp ini backstep di ronde ke-50 buat ngetes dan pelajarin strategi lawannya buat ngelihat Apakah ada kelemahan yang dia bisa manfaatin habis semua permainan dimainkan hasilnya itu dihitung lalu disortir dari paling atas ke paling bawah yang paling menarik program yang paling sederhana itu yang paling menang namanya itu tet for tet tet for tet mulanya itu kooperatif lalu dia bakal niru persis Apa yang dilakukan Lawannya pada move terakhir jadi tit for tat bakalan copy paste koperasi dengan koperasi nge-backstep dengan backstep tapi cuman sekali Kalau misalnya lawannya itu berkoperasi lagi dia juga bakal balik lagi berkoperasi juga saat te fortad ngelawan freitman keduanya itu mulai dengan berkooperasi dan terus berkooperasi skornya itu maksimal gara-gara berkooperasi secara full dari awal sampai akhir saat te forte itu bermain lawan jos dua-duanya itu mulai dengan berkoperasi tapi di ronde keenam si jos ini ngeback step dan ini memicu perlawanan yang bolak-balik dan ini bisa bikin kalian ngertiin geopolitik juga di mana Iran baru aja ngirim misal soalnya dia itu harus Serang balik gara-gara Israel nyerang embassi Iran dan ngebunuh Jenderal mereka tapi masalahnya kalau misalnya lawan jos ada 10% kans dia itu randomly nge-backstap padahal musuhnya itu lagi Kagak nge-backstap hasilnya itu jadi parah soalnya dua-duanya bakalan nge-backstep selamanya ini juga sama ya yang kayak kita lihat dalam politik dan hubungan internasional dan gara-gara pada saling balas dendam tit for Tad dan Jos hasilnya itu jelek tapi gara-gara tit for Tad berhasil berkooperasi dengan cukup banyak dengan strategi lainnya te for T tetap dapat skor yang paling tinggi yang paling mind blowing semua strategi dengan kinerja terbaik termasuk tit for tat memiliki empat kualitas pertama mereka semua adalah strategi yang jadi orang baik dia boleh nge-backstep tapi itu khusus respons lawannya yang udah jahat duluan jadi Tid for t adalah strategi orang baik dia bisa ngelawan tapi cuman sebagai pembalasan sebaliknya ada strategi orang jahat definisi egi orang jahat adalah strategi yang ngebackstp duluan jadi jos ini tergolong jahat dari 15 strategi turnamen Ini Del strategi itu orang baik dan tujuhnya itu strategi yang jahat Del strategi teratas semuanya itu strategi orang baik dan bahkan strategi orang baik dengan kinerja yang paling jelek itu masih jauh lebih unggul daripada strategi jahat dengan skor yang paling tinggi lalu kualitas penting kedua adalah memaafkan strategi memaafkan adalah strategi yang bisa balas tapi dia itu enggak nyimpan dendam jadi tit for tat adalah strategi pemaaf dia bakal ngebalas kalau misalnya lawannya itu nge-back step tapi apa yang terjadi sebelum-sebelumnya kecuali ronde yang terakhir itu enggak bakal mempengaruhi keputusan saat ini Friedman di sisi lain itu strategi yang tidak kenal ampun kalau misalnya dia udah di backstep sekali aja strategi freedman itu bakal membabi buta dan Hajar terus sampai permainan selesai enggak ada ampun dan kadang-kadang ada dari kita yang kayak gitu ya maunya itu keras enggak ada ampun dan itu mungkin bikin kita ngerasa hebat dan kuat tapi strategi ini enggak baik dalam jangka panjang kesimpulan bahwa orang baik dan Memaafkan itu malah jadi yang unggul itu ngagetin banyak parap ahli banyak yang coba untuk jadi ricik dan bikin strategi yang nge-backstep duluan dengan harapan mereka itu bisa dapat keunggulan sedikit demi sedikit dan akhirnya jadi pemenang tapi semuanya itu gagal dalam jangka panjang lalu diulangi lagi dengan turnamen nomor du dan sekarang ada 62 strategi yang berbeda dan S satu yang random dan peserta turnamennya ini pada tahu hasil ronda Pertama Dan mereka bisa pakai hasil dari apa yang mereka pelajarin buat mikirin strategi yang baru ini bikin dua kubu ada yang mikir bahwa jadi orang baik dan pemaaf itu sifat yang unggul jadi strateginya itu megang prinsip orang baik dan yang memaafkan kubu kedua mengantisipasi bahwa orang lain itu bakalan jadi orang baik dan pemaaf dan mungkin terpengaruh dengan mantra nice guys finish last Jadi mereka nyoba strategi orang jahat dan berusaha buat ngambil kesempatan dari orang-orang yang baik dan pemaaf salah satu strategi yang jahat ini adalah tester di ronde pertama dia langsung nge-backstep buat Lihat reaksi lawannya kalau misalnya lawannya itu ngebalas tester bakal minta maaf dan main kayak tit for t untuk sisa durasi gameennya kalau misalnya lawannya itu ternyata kagak ngebalas tester bakal nge-backstep setiap dua ronda sekali tapi sekali lagi jadi orang yang jahat itu ternyata enggak ada gunanya dan sekali lagi tit for tat adalah strategi yang paling efektif strategi jadi orang baik itu ternyata tetap paling bagus karena antara 15 strategi teratas cuman satu strategi itu yang jahat sebaliknya antara 15 strategi peringkat terbawah cuman satu strategi orang baik dan setelah turnamen kedua ael Rod mengidentifikasi kualitas lain yang membedakan strategi yang hasilnya bagus lawan yang enggak bagus kualitas yang ketiga adalah retailatory artinya kalau misalnya lawan melakukan serangan segera Serang balik Jangan mau dibully dan diinjek injak di sisi lain ada strategi always cooperate yang selalu berkoperasi mau apapun lawannya milih mau nyerang Dia Atau mau baik sama dia tapi hasilnya dia ini dibully dan diinjak habis-habisan jadi always cooporate terlalu mudah untuk dimanfaatin Tip for tap di sisi lain sangat susah untuk dimanfaatin kualitas terakhir yang diidentifikasi adalah komunikasi dengan jelas strategi yang enggak jelas yang terlalu ngacak bikin susah untuk dipahami soalnya susah buat ngeembangun pola kepercayaan terhadap program seperti itu lu enggak bakal bisa paham apa yang dia bakal lakukan jadi setiap kesempatan sekalian aja lu Hajar dia juga jadi menarik ya Empat kualitasnya itu adalah jadi orang yang baik pemaaf retilitary alias enggak bisa nerima buat diinjak-injak dan juga komunikasi dengan jelas dan ini bisa Menjelaskan langkah yang dilakukan sama Iran di sini gua bukan di sisi Iran atau Israel Ya dan tentunya gua tidak membenarkan siapapun yang nyerang tapi kita harus bisa memposisikan diri di masing-masing negara secara Netral supaya kita bisa baca dan tahu apa yang kita perlu lakukan dan gua pakai contoh ini soalnya ini contoh yang paling baru kejadian tanggal 1 April 2024 Embassy Iran itu diserang sama Israel lalu 14 April 2024 Iran ngebalas Iran komunikasi dengan jelas bahwa setelah serangan ini udah case closed kecuali Israel memutuskan untuk nyerang balik lagi Jadi enggak ambigu positioning-nya lalu Iran juga cuma nyerangnya itu sekali atas serangan Israel bukan strategi di mana Kalau misalnya dia itu diserang dia bakal membabi buta dan nyerang Israel selamanya dan kalau misalnya lu paham ini lu jadinya tahu cara ngebaca media dengan bijak gua baca di media-media apalagi di media yang barat ya Ini tuh seakan-akan irannya yang mau mengeskalasi Tension di Timur Tengah padahal dari cara Iran melakukan serangannya terhadap Israel ini tuh sudahud jelas-jelas sebuah simbol bahwa mereka itu kagak mau mengeskalasi dari game theory Kita paham bahwa Iran ini menunjukkan kualitas retilitory alias mereka enggak nerima kalau misalnya mereka ini diinjak tapi mereka juga memaafkan mereka Consider ini sudah case closed enggak mau memperpanjang walaupun Jenderal mereka udah jadi korban komunikasinya ini super jelas jadi Iran tentunya berharap ini tidak mengeskalasi Tension di Middle East tapi mereka ngasih unjuk bahwa mereka enggak nerima anex embassy-nya itu dihajar dan jenderalnya mereka ini dibunuh bahkan sebelum mereka luncurin 300-an misal Iran sudah ngasih tahu bahwa mereka bakal nyerang bahkan Ngasih waktu supaya Israel dan allies-nya itu bisa nge-defend yang diklaim Israel itu 99% misalnya itu berhasil ditangkis Coba kalian pikir waktu Rusia nyerang Ukraina Emangnya Putin bilang bahwa dia itu bakal nyerang Ukraina sama sekali Kagak dia cuma bilang ini lagi latihan enggak ada rencana nyerang tapi tiba-tiba akhirnya surprise langsung dihajar tentu kita semua berharap ya Tension di Timur Tengah ini bisa menurun tapi minimal secara niat kita paham bahwa Iran ini sebenarnya enggak seagresif yang dikasih unjuk media-media barat dan ada satu lagi yang harus dinote dalam prisoners Dilema enggak ada satu strategi yang bulletproof dan selalu ranking satu strategi yang terbaik itu selalu tergantung sama lawan sekitarnya Strategi apa yang lawannya itu pakai ranking-ranking ini bisa berubah tergantung dari lawannya misalnya kalau misalnya kita nempatin tet for tat di lingkungan lawan-lawan yang paling jahat dan selalu nge-backstep ranking te for t itu yang terakhir tapi secara long term kalau misalnya kita jalanin simulasinya strategi yang jahat itu bakal extinct duluan dan dalam jangka panjang cuman strategi orang baik itu yang bakalan Survive bahkan strategi T for t Itu yang di atas dan proses ini ada kemiripannya sama evolusi yang dulunya setiap organisme itu cuma mikirin dirinya sendiri ke sekarang di mana berkooperasi dan gotong royong itu malah yang hidup dari clownfish dan animuni ke lebah dan bunga bahkan ke manusia dan bakteri ada dua pelajaran lagi yang paling penting dan gua janji kalau misalnya lu dengerin sampai akhir lu bakalan blown away Yang pertama apa yang terjadi kalau misalnya ada sedikit random error di simul kita ada noise di sistem soalnya dunia ini enggak selalu hitam putih dan Kita sebagai manusia suka miscom dan berasumsi misalnya satu pemain mau berkooperasi tapi persepsi lawannya dia ini mau nge-backstep random error kayak gini selalu terjadi di dunia nyata misalnya di tahun 1983 satelit Soviet mendeteksi peluncuran rudal balistik antar benua dari Amerika padahal Amerika tidak ngeluncurin apapun ada sebuah error yang mendeteksi pantulan sinar matahari dari a sebagai rudal balistik untungnya stanislav petrov perwira Soviet yang bertugas mengabaikan peringatan tersebut Nah di sini kita bisa lihat bahwa potensi kerugian akibat kesalahan signal ini bisa jadi masalah hidup dan mati bahkan saat itu ini bisa jadi hidup dan matinya seluruh planet keseluruhan kehidupan dan kemanusiaan ini bisa musnah semua sekarang kita simulasiin game-nya yang ada noise ranking sat lawan ranking sat tet for t lawan tet for t sendiri keduanya mulai dengan bekerja sama tapi kalau misalnya ada yang mau koperatif tapi lawannya ngira dia ini mau nge-backstep makanya ti for TAD yang satu lagi bakal ngebalas dan akhirnya pada saling serang-serangan sampai enggak selesai-selesai dan yang bikin parah kalau misalnya di satu ronde tit for t yang mau berkooperasi ini salah dilihat sekali lagi sebagai aksi yang nyerang maka sisa gameennya ini adalah serang-serangan terus sampai habis lawan yang enggak ada noise tit foret ini berubah dari yang skornya itu bagus jadi skor yang jelek Jadi gimana cara ngatasinnya Nah kita butuh strategi untuk keluar dari spiral balas-balasan yang enggak selesai-selesai ini dan salah satu cara untuk melakukan ini adalah dengan bermain tet for tet tetapi dengan tambahan memaafkan sekitar 10% lebih banyak jadi bukannya ngebalas setelah setiap serangan Lu cuma ngebalas dari 10 serangan ini ngebantu Lu buat keluar dari spiral ngebalas-balasan yang enggak selesai-selesai sambil tetap memberikan posisi yang tegas bahwa lu ini enggak bisa dimanfaatin soalnya dari 10nya lu tetap hajar balik dan ini menurut gua yang paling keren kalau misalnya kita lihat secara detail tet for tet ini enggak bakal pernah menang lawan pemain yang dia itu lagi lawan maksudnya kayak gini secara desain yang tit for tet bisa dapat cuman kalah atau seri soalnya dia itu selalu mulai dengan berkooperasi dan dia cuman copy paste apa yang lawannya itu lakukan tapi kalau misalnya hasil dari seluruh interaksi antara strategi-strategi yang berbeda itu ditotalin tit for tat itu lebih unggul dibandingkan strategi lainnya di sisi lain always defect alias selalu nge-backstep 100% 100%-nya itu enggak pernah Kalah dalam pertarungan satu lawan satu dia cuma bisa seri atau menang tapi kalau misalnya kita totalin skor dari hasil seluruh interaksi lawan strategi-strategi yang berbeda ranking mereka itu malah dibawah makanya ini super menarik ya Soalnya banyak yang mikir definisi kemenangan itu artinya kita harus menang lawan kompetisi kita padahal we may lose the battle but not the war dan Ini contohnya ada di mana-mana ya Mulai dari kerukunan keluarga kalau misalnya kita lagi berantem sama pasangan kita kadang-kadang kita itu maunya yang paling menang kita maunya jadi yang terakhir buat nyemprot padahal sering kali kalau misalnya kita bisa bersabar lebih 10% memaafkan mungkin saat itu kita bisa ngerasa kita itu kalah tapi untuk perkawinan kita kalau misalnya kita lebih sering Memaafkan itu bakal lebih baik apalagi banyak pertengkaran itu mulai dengan komunikasi yang enggak clear alias noise dan empat pelajaran ini juga jadi filosofi cara gua menjalankan contonent di content Creation ada orang yang cara bikin viralnya itu dengan nyerang dan nenggol konten crereator lain mungkin itu cara yang efektif ya supaya namanya itu bisa cepat jadi perbincangan banyak orang dan juga jadi heboh tapi gua percaya dalam jangka panjang hasilnya itu enggak bakalan lebih baik daripada orang yang enggak pernah nyerang duluan dan dalam berbisnis pun juga Sama ya dengan tim sendiri di kantor kita harus jadi leader yang baik yang enggak ngungkit-ngungkit kesalahan masa lalu yang bakal nghukum karyawan yang enggak baik Misalnya tukang nyuri duit dan komunikasinya itu tetap harus jelas kenapa dia itu bersikap tegas semoga video ini membantu ya ini sedikit summary dari game theorynya veritasium dan kalau misalnya lu mau nonton podcast gua bareng sama anak se naga dan nyanyian dia tentang kasus-kasus korupsi lu bisa Klik di sini atau kalau misalnya lu mau tahu Aplikasi apa yang terbaik untuk beli Rex danana lu bisa Klik di sini thank you and I will see you guys again in the next video [Musik]