[Day 22] Graph - νμ΄μ§λν¬ & μ ν
π PageRank
π₯ λ°°κ²½
- μΉ = Web page + Hyper LinkμΈ λ°©ν₯μ± μλ κ·Έλν
- κ΅¬κΈ μ΄μ μ κ²μ μμ§μΌλ‘λ λλ ν λ¦¬λ‘ μΉμ μ 리νλ κ²½μ°κ° μμμ
-> μΉνμ΄μ§ μ μ¦κ°μ λ°λΌ μΉ΄ν κ³ λ¦¬μ μμ κΉμ΄λ 무νμ 컀μ§λ λ¬Έμ λ°μ
- λ€μμΌλ‘λ ν€μλμ μμ‘΄ν κ²μ μμ§μ΄ μμμ
-> μ¬μ©μκ° μ λ ₯ν ν€μλμ λν΄, ν΄λΉ ν€μλλ₯Ό μ¬λ¬ λ² ν¬ν¨ν μΉνμ΄μ§λ₯Ό λ°ν
-> μ μμ μΌλ‘ μ¬μ©ν κ°λ₯μ±μ΄ λμ(μ±μΈ μ¬μ΄νΈμ 'μ΄λ'μ΄λΌλ ν€μλλ₯Ό 보μ΄μ§ μκ² μ¬λ¬ λ² ν¬ν¨νλ©΄, 'μ΄λ'μ κ²μνμ κ²½μ° ν΄λΉ μ±μΈ μ¬μ΄νΈκ° κ²°κ³Όλ‘ λμ¬ μ μμ)
- ꡬκΈμμλ μ¬μ©μ ν€μλμ κ΄λ ¨μ±μ΄ λκ³ μ λ’°ν μ μλ μΉνμ΄μ§λ₯Ό μ°ΎκΈ°μν΄ λ Έλ ₯νμ
π₯ μ μ(ν¬ν, μμ 보ν)
- ν¬ν κ΄μ μμ λ³Έ νμ΄μ§λν¬κ° μλ€.
-> ν¬ν(μΉνμ΄μ§κ° νμ΄νΌλ§ν¬λ₯Ό ν΅ν΄ ν¬ν)λ₯Ό ν΅ν΄ μ¬μ©μκ° μνλ μΉνμ΄μ§λ₯Ό μ°Ύμ
-> λ€μ΄μ€λ κ°μ μ΄ λ§μμλ‘ μ λ’°λκ° λμμ§
=> νμ§λ§ μ΄λ μ μ©μ μμ§κ° μμ
=> μ΄λ»κ² λ§μ μ μμκΉ? κ°μ€μΉ
- μμ 보ν(Random Walk) κ΄μ μμ μ μ
-> μμ 보νμ ν΅ν΄ μΉμ μννλ μΉμνΌλ₯Ό κ°μ : μΉμνΌλ νμ¬ pageμμ νμ΄νΌλ§ν¬λ₯Ό κ· μΌν νλ₯ λ‘ ν΄λ¦
-> μΉμνΌκ° tλ²μ§Έ λ°©λ¬Έν μΉνμ΄μ§κ° μνλ iνμ΄μ§μΌ νλ₯ μ p_i(t)λΌκ³ νλ€λ©΄ p(t)λ μΉνμ΄μ§ μμ κ°μ νλ₯ λΆν¬ 벑ν°
-> κ·Έλ κ² λλ€λ©΄ μλ μμ΄ μ±λ¦½
-> μΉμνΌκ° μ΄ κ³Όμ μ 무νν λ°λ³΅νκ³ λλ©΄(tκ° λ¬΄νλλ‘κ°λ©΄) νλ₯ λΆν¬λ p(t)μ μλ ΄(μ¦, p(t) = p(t+1) = p)
=> μλ ΄ν pλ₯Ό μ μ λΆν¬(Stationary Distribution)μ΄λΌκ³ ν¨.
=> μλμ κ°μ΄ μμ λ³κ²½ν μ μμ
- ν¬νμ κ΄μ μμλ μμ 보νκ΄μ μμλ κ²°κ΅ κ°μ μμ΄ λμΆλ λ€λ κ²μ μ μ μμ.
π₯ κ³μ°
- λ°λ³΅κ³±(Power Iteration)μ μ¬μ©
- νμ§λ§ λ°λ³΅κ³±μ΄ νμ μλ ΄νλ κ²μ μλλ€!
-> λ€μ΄μ€λ κ°μμ μμ§λ§ λκ°λ κ°μ μ΄ μλ μ€νμ΄λ νΈλ©(Spider trap)μμ λ¬Έμ κ° λ°μ
- λν λ°λ³΅κ³±μ΄ 'ν©λ¦¬μ μΈ' μ μλ‘ μλ ΄νλ κ²μ 보μ₯νμ§ μλλ€!
-> λ€μ΄μ€λ κ°μ μ μμ§λ§ λκ°λ κ°μ μ΄ μλ λ§λ€λ₯Έ μ μ (Dead End)μμ λ¬Έμ κ° λ°μ
=> μ΄λ¬ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ μκ°μ΄λ(Teleport)μ λμ
- μμ 보ν κ΄μ μμ 보κ²λλ©΄ μλμ κ°λ€.
-> μλμ κ°μ μμ΄ μνλ¨.
π μ ν
π₯ μ νμ μμ
- μ 보, νλ, κ³ μ₯, μ§λ³ λ±μ΄ μ‘΄μ¬
-> μ νμ κ³Όμ μ 체κ³μ μΌλ‘ μ΄ν΄νκ³ λμ²νκΈ° μν΄μλ μνμ λͺ¨ννκ° νμ
=> μμ¬ κ²°μ κΈ°λ°, νλ₯ μ μ ν λͺ¨ν λ±μ΄ μ‘΄μ¬
π₯ μμ¬κ²°μ κΈ°λ°μ μ ν λͺ¨ν
- μ£Όλ³ μ¬λλ€μ μμ¬κ²°μ μ κ³ λ €ν΄ κ°μ μμ¬κ²°μ μ λ΄λ¦¬λ κ²½μ°μ μ¬μ©(μ ν μκ³μΉ λͺ¨νμ΄ μ‘΄μ¬)
- μ ν μκ³μΉ λͺ¨ν(Linear Threshold Model)
-> μΉκ΅¬ κ΄κ³μ λ μ¬λ u, vκ° μμ κ²½μ°, AκΈ°μ κ³Ό BκΈ°μ μ€ νλλ₯Ό μ νν΄μΌνλ€.
-> Aλ₯Ό λλ€ κ³ λ₯Ό κ²½μ° aλ§νΌ λ§μ‘±λκ° μκ³ , Bμ κ²½μ° bλ§νΌ λ§μ‘±λκ° μλ€. νμ§λ§ λ€λ₯Ό κ²½μ° 0μ΄λ€.
- μμ κ²½μ°μλ μμ²λκ² μμ λ€νΈμν¬λ₯Ό 보μλ€λ©΄ μ΄λ§μ΄λ§νκ² ν° μμ λ€νΈμν¬λ₯Ό 보μ.
- λ§μ½ 2a > 3bλΌλ©΄ Aλ₯Ό μ ννκ³ λλ¨Έμ§μ κ²½μ°λ Bλ₯Ό μ ννλ€κ³ νμ.
- κ·Έ κ²½μ° pμ λΉμ¨μ μ΄μμ΄ Aλ₯Ό μ ννκ³ (1-p)μ λΉμ¨μ΄ Bλ₯Ό μ ννλ€κ³ ν μ μλ€. λ°λΌμ Aλ₯Ό μ ννκ² λ κ²½μ°λ pa > (1-p)bκ° λκ³ μ΄λ₯Ό μ 리νλ©΄ μλμ κ°λ€.
p > b/(a+b) ==> μ¬κΈ°μ b/(a+b)λ₯Ό μκ³μΉ qλΌκ³ νλ€.
π₯ νλ₯ μ μ ν λͺ¨ν
- COVID-19μ κ°μ μμ¬ λ°νμ΄ μλ νλ₯ μ μΌλ‘ κ°μΌμ΄ λλ κ²μ μ¬μ©λλ λͺ¨λΈ
-> λ 립 μ ν λͺ¨ν(Independent Cascade Model)
- λ 립 μ ν λͺ¨ν
-> λ°©ν₯μ±μ΄ μκ³ κ°μ€μΉκ° μλ κ·Έλν
-> κ°μ (u, v)μ κ°μ€μΉ P_u,vλ vκ° κ°μΌλμ§ μκ³ uκ° κ°μΌλμ΄ μμ λ, uμκ²μ vκ° κ°μΌλ νλ₯ μ μμλ‘ λ€ μ μμ(λ¨, κ°μΌμλ νλ³΅μ΄ μλλ€λ μ μ )
=> ν볡μ κ°μ νλ SIS, SIRλ±μ λͺ¨νμ΄ μ‘΄μ¬
π₯ λ°μ΄λ΄ λ§μΌν κ³Ό μ ν μ΅λν λ¬Έμ
- λ°μ΄λ΄ λ§μΌν : μλΉμλ€λ‘ νμ¬κΈ μνμ κΈμ μ μΈ μ μλ¬Έμ λ΄κ²νλ κΈ°λ²(ex. μμ μΈν루μΈμμ κ΄κ³ )
-> λνμ μΌλ‘ 'λ―Έλ€ν΄ ν¨κ³Ό(Kate Middleton Effect)'κ° μμ
- μ ν μ΅λν λ¬Έμ (Influence Maximization Problem)
-> μλ μ§ν©(Seed set)μ μ νν μ μμ λ, κ·Έλν, μ νλͺ¨ν, μλ μ§ν©μ ν¬κΈ°λ₯Ό κ³ λ €ν΄ μ νλ₯Ό μ΅λν νλ μλμ§ν©μ μ°Ύλ λ¬Έμ . μ¦, μν₯λ ₯ μλ μλ μ§ν©μ μ°Ύμλ΄λ λ¬Έμ
-> κ·Έλνμ |v|κ°μ μ μ μ΄ μμ κ²½μ°, μλ μ§ν©μ ν¬κΈ°λ₯Ό Kλ‘ μ ννλλΌλ κ²½μ°μ μλ |v| combination kμ΄λ€.
=> μ μ : 10,000κ°, k: 10μ΄λΌκ³ νμλμλ κ²½μ°μ μλ 2.7x10^34κ°λ λ¨ => NP-hardμ(κ±°μ λΆκ°λ₯)
- λ°λΌμ κ·Όμ¬μ (ν΄λ¦¬μ€ν±)μΌλ‘ μ κ·Ό
-> μ μ μ μ€μ¬μ±(Node Centrality)μ μ¬μ©(νμ΄μ§ λν¬ μ μ, μ°κ²° μ€μ¬μ±, κ·Όμ μ€μ¬μ±, λ§€κ° μ€μ¬μ± λ±μ΄ μμ)
-> ν©λ¦¬μ μ΄μ§λ§, μ΅κ³ μ μλ μ§ν©μ μ°Ύλλ€λ 보μ₯μ μμ
π₯ νμ μκ³ λ¦¬μ¦(Greedy Algorithm)
- μλ μ§ν©μ μμλ₯Ό νλ²μ νλμ© μ ννμ¬ λͺ©ννλ ν¬κΈ°μ μλ μ§ν©μ λλ¬ν λκΉμ§ λ°λ³΅νλ μκ³ λ¦¬μ¦
- ν΄λΉ μκ³ λ¦¬μ¦μ κ²½μ° μ νλλ μνμ μΌλ‘ λ€μκ³Ό κ°λ€.