[백준] 1969번 DNA

티스토리 뷰

알고리즘 문제 풀이/백준

[백준] 1969번 DNA

개발미정 2021. 7. 31. 00:56

실버5단계의 문제이다.

N개의 DNA가 주어지고, Hamming Distance가 가장 작게 나오는 DNA 서열을 구하는 문제이다.

이 문제는,

각각의 서열을 인덱스로 접근하여서 가장 많이 나온 알파벳을 추가하는 방식으로 문제를 해결했다.

처음에 문제를 끝까지 다 안읽어서 멀리까지 돌고 돌다가 왔다..ㅎㅎ

"그러한 DNA가 여러 개 있을 때에는 사전순으로 가장 앞서는 것을 출력한다."

만약 DNA 서열들의 1번 인덱스가 A 1개, T 1개, G 1개, C 1개 있다고 했을 때 A를 추가해주면 되는데, 위에 문장을 안읽고 각각 넣어보고 다른 서열들과 비교해서 Hamming Distance가 가장 작은 것을 찾는 방식으로 풀다가 포기했다..ㅎ

오늘의 교훈문제 끝까지 읽자..^~^

해결코드

N, M = map(int, input().split())

DNAs = []
for n in range(N):
    DNAs.append(input())

min_sum = 0xffffffff
# target = []

# 길이가 M인 문자열을 돌면서 가장 알파벳이 많이 나온 것을 찾아서 조합한다.
result = ""
# 길이가 M이니까 앞에서부터 돌면서
for m in range(M):
    # 각각 알파벳의 개수를 세어준다.
    atgc = [[0, "A"], [0, "T"], [0, "G"], [0, "C"]]
    # 모든 DNA를 돌면서 해당 인덱스에 맞는 알파벳에 +1를 해준다.
    for dna in DNAs:
        if dna[m] == "A": atgc[0][0] += 1
        elif dna[m] == "T": atgc[1][0] += 1
        elif dna[m] == "G": atgc[2][0] += 1
        elif dna[m] == "C": atgc[3][0] += 1
    
    # 가장 많이 나온 알파벳부터 추가를 해본다.
    max_alphabet = ""
    maxV= -1
    for i in atgc:
        # print(type(i[0]), type(maxV))
        if i[0] > maxV:
            max_alphabet = i[1]
            maxV = i[0]
        elif i[0] == maxV:
            max_alphabet = i[1] if ord(i[1]) < ord(max_alphabet) else max_alphabet

    result += max_alphabet

dist = 0
for dna in DNAs:
    for m in range(M):
        if result[m] != dna[m]:
            dist += 1
print(result)
print(dist)

'알고리즘 문제 풀이 > 백준' 카테고리의 다른 글

[백준] 도영이가 만든 맛있는 음식 Python (0)	2021.09.03
[백준] 16197 두 동전 Python (0)	2021.08.29
백준 1120 문자열 Python (0)	2021.07.23
백준 8911 거북이 Python (0)	2021.07.08
백준 2156 포도주시식 Python (0)	2021.06.16

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

글 보관함

티스토리 뷰

[백준] 1969번 DNA

'알고리즘 문제 풀이 > 백준' 카테고리의 다른 글

티스토리툴바