Topological Sort (위상 정렬) 개요

Topological sort는 Direct Acyclic Graph의 경우에서 문제를 해결하는 방법이다.

방향이 존재하는 그래프에서 각 vertex의 선행 순서 정보를 유지하면서 모든 vertex를 탐색하는 알고리즘이다.

Type of Edges

알고리즘을 알아보기 전에, Direct Acyclic Graph를 알기 위해 방향이 있는 그래프에서 DFS를 실행할 때 나타나는 edge의 종류를 먼저 정리해 보자.

 

  • Tree Edge: 새로운 정점을 만났을 때 생기는 edge. Edge는 한 정점에서 다른 정점을 이을 때 발생하게 된다. Tree Edge는 어떤 정점이 새로운 정점과 연결될 때 생기는 edge를 말한다.

Tree Edge

  • Back Edge: Back Edge는 트리에서 자손에 위치한 노드가 조상 노드와 이어지는 edge를 말한다.

Back Edge

 

  • Forward Edge: Forward Edge는 조상 노드가 자손 노드와 이어지는 edge를 말한다.

Forward Edge

  • Cross Edge: 현재 탐색 중인 트리가 다른 탐색이 끝난 다른 서브트리와 이어지는 경우에 발생하는 edge를 말한다.

Cross Edge

 

Edges in Undirected

Directed Acyclic Graph에서는, 위 네 개의 edge 중 존재할 수 없는 edge들이 있다.

  • forward Edge : 우리는 forward edge가 조상 노드와 자손 노드가 이어지는 것이라고 정의했다. 이 상황에서 자손 노드는 현재 탐색 중인 노드여야 하는데, 현재 탐색 중인 노드가 그 조상 노드와 연결되는 것은 불가능하다. 자손 노드에 도달했다는 것은 이미 조상 노드가 탐색 중 상태인 gray 상태인 것을 의미하고, gray에서 gray 로의 연결은 허용되지 않기 때문이다.
  • Cross Edge : 만약 어떤 두 서브트리가 연결되어 있다고 하자. 그렇다면 dfs에서 한 서브트리를 탐색하면서 반대편에 위치한 서브트리까지 함께 탐색할 수밖에 없다. 왜냐하면 dfs는 더 이상 진행할 자녀 노드가 없을 때까지 계속해서 그래프를 타고 가기 때문이다.

따라서 방향이 없는 그래프에서 존재하는 edge는 Back Edge와 Tree Edge 뿐이다.

 

Alogorithm

위상 정렬은 다음과 같은 순서로 구현한다.

  • DFS 통해 그래프에 속한 모든 노드들의 finish time을 마킹한다. 𝛩(V + E)
  • 가장 늦게 끝난 노드를 링크드 리스트 제일 앞에 위치시킨다. 𝛩(V)

정말 단순한 알고리즘이다. 그래프 vertex의 순서는 이미 edge의 방향에 의해 정리되어 있기 때문에 우리는 그냥 dfs로 모든 vertex를 탐색해주기만 하면 된다. 그리고 시간 복잡도는 DFS의 시간인 𝛩(V+E)가 된다.

 

Example 문제

N명의 학생들을 키 순서대로 줄을 세우려고 한다. 각 학생의 키를 직접 재서 정렬하면 간단하겠지만, 마땅한 방법이 없어서 두 학생의 키를 비교하는 방법을 사용하기로 하였다. 그나마도 모든 학생들을 다 비교해 본 것이 아니고, 일부 학생들의 키만을 비교해 보았다.

일부 학생들의 키를 비교한 결과가 주어졌을 때, 줄을 세우는 프로그램을 작성하시오.

 

입력

첫째 줄에 N(1≤N≤32,000), M(1≤M≤100,000)이 주어진다. M은 키를 비교한 횟수이다. 다음 M개의 줄에는 키를 비교한 두 학생의 번호 A, B가 주어진다. 이는 학생 A가 학생 B의 앞에 서야 한다는 의미이다.

학생들의 번호는 1번부터 N번이다.

 

출력

첫째 줄부터 앞에서부터 줄을 세운 결과를 출력한다. 답이 여러 가지인 경우에는 아무거나 출력한다.

풀이

Topological Sort, 위상 정렬로 풀 수 있는 문제이다. 위상 정렬은 DFS에서 각 노드의 탐색이 완전히 끝날 때 그 순서를 기록해 두고 최종적으로는 그 역순으로 출력해 주면 된다. 위상 정렬은 DAG(Directed Acyclic Graph), 사이클이 없는 일방향 그래프에서만 가능하다. DFS를 진행하면서 탐색이 끝날 때마다 스택에 해당 값을 넣어주고, 중복된 노드를 연속으로 탐색하지 않도록 visited 마킹을 해준다.

코드

#include <cstdio>
#include <vector>
#include <stack>
#include <utility>
#include <algorithm>
 
using namespace std;
 
vector<vector<int>> adj (32001);
stack<int> lineup;
bool visited[32001];
 
void dfs (int s){
    visited[s] = true;
 
    for (int i = 0 ; i < adj[s].size() ; i++){
        if (!visited[adj[s][i]]){
            dfs(adj[s][i]);
        }
    }
    lineup.push(s);
}
 
int main (){
    int N, M;
    scanf("%d %d", &N, &M);
 
    for (int i = 0 ; i < M ; i++){
        int a, b;
        scanf("%d %d", &a, &b);
        adj[a].push_back(b);
    }
 
    for (int i = 1 ; i <= N ; i++){
        if (!visited[i]){
            dfs(i);
        }
    }
 
    while(!lineup.empty()){
        printf("%d ", lineup.top());
        lineup.pop();
    }
}