Nature Methods 데이터 시각화 컬럼 모음
Bang Wong, Martin Krzywinski, Nils Gehlenborg, Cydney Nielsen, Noam Shoresh, Rikke Schmidt Kjaergaard, Erica Savig, Alberto Cairo이 Nature Methods에 데이터 시각화에 대한 컬럼을 35편 썼습니다. 이글은 이런 자료들을 더 쉽게 찾아볼 수 있도록 한곳에 모아 정리한 것으로 많은 분들이 데이터 시각화를 하는데 도움이 되길 바랍니다.1
0.1 생물학 데이터 시각화는 필수 도구
오늘날 생물학 연구에서는 방대한 양의 데이터가 쏟아져 나오고 있으며 데이터를 효과적으로 탐색하고 소통하기 위해 데이터 시각화가 필수적입니다. 데이터 시각화의 궁극적인 목표는 복잡한 데이터를 사람들이 쉽고 명확하게 이해하고 설명할 수 있도록 돕는 것입니다. 모든 생물학적 데이터에 시각화가 필요한 것은 아닙니다. 하지만 다음과 같은 경우 데이터 시각화는 강력한 이점을 갖습니다.
- 패턴 탐색: 데이터의 규칙성을 아직 모를 때 시각화는 패턴을 찾아내는 데 효과적입니다.
- 알고리즘 보완: 자동화된 계산으로는 파악하기 어려운 데이터의 세부 사항(예: 유전체학의 구조적 변이)을 시각적으로 명확하게 이해할 수 있도록 돕습니다.
결론적으로 잘 디자인된 데이터 시각화는 복잡한 인지적 평가를 직관적인 지각적 이해로 바꿔주기 때문에 데이터를 이해하는 데 강력한 도움이 됩니다. 특히 방대한 데이터가 생산되는 현대 생물학 연구에서 시각화는 매우 중요한 역할을 합니다.
1 구성 및 레이아웃
1.1 쉽고 명확한 정보 전달을 위한 디자인
디자인의 가장 중요한 원칙은 유용성과 기능입니다. 잘 만들어진 물건이 쓰기 쉬운 것처럼 여러분의 그래프와 포스터도 보고 이해하기 쉬워야 합니다. 훌륭한 디자인은 그 물건이 어떤 기능을 하는지 명확한 단서를 주는 것입니다. 예를 들어, 지하철 노선도는 도시의 한 곳에서 다른 곳으로 이동하는 방법을 찾는 데 매우 효율적인 도구입니다. 만약 기차 정보를 단순히 정류장과 연결 표로만 제공한다면 두 지점 사이의 가장 빠른 길을 찾는 것은 훨씬 더 어려울 겁니다.
따라서 그래프를 디자인할 때는 정보를 표현하는 체계적인 방법을 사용 하는 것이 중요합니다. 다른 종류의 정보를 명확하게 구분해 독자들이 발표 내용을 쉽게 이해할 수 있게 해야합니다.
또한 탄탄한 디자인 아이디어 개념과 뛰어난 기술 실행 능력이 좋은 결과물을 만드는 데 필요합니다. 디자인은 탐색적인 과정이므로 머릿속의 아이디어를 현실로 만들고 필요에 따라 그래픽 요소를 다듬을 수 있는 능력이 필요합니다. 그러니 그래픽 소프트웨어를 능숙하게 다룰 수 있도록 시간을 투자하세요.
1.2 레이아웃: 정보 전달을 위한 시각적 정리의 기술
레이아웃은 발표 자료를 명확하게 만들기 위해 글과 그림을 페이지에 보기 좋게 배치하는 작업입니다. 그래픽 디자인에서는 모든 시각적인 정보를 전달하는 데 레이아웃이 가장 기본이 됩니다. 내용을 잘 정리하면 복잡한 정보도 독자들이 쉽게 따라갈 수 있지만 자료가 뒤죽박죽이면 독자들을 헷갈리게 합니다.
많은 예술가들은 ’황금 비율’이라는 특별한 수학적 관계를 사용합니다. 황금 비율은 어떤 선을 두 부분으로 나눴을 때, 전체 길이와 긴 부분의 비율이 긴 부분과 짧은 부분의 비율과 같아지는 것을 말합니다(대략 13:8 비율). 또한 황금 비율과 관련이 있는 ’피보나치 수열’은 그래픽 디자인에 많은 영향을 줍니다.(예 1, 2, 3, 5, 8, 13 등). 피보나치 숫자는 사용해 글꼴 크기나 책 페이지 레이아웃을 결정에 자주 사용되기 때문이죠.
황금 비율을 실제로 활용하는 방법은 우리가 만드는 슬라이드와 포스터에 조화로운 비율을 적용하는 것입니다. 이는 단순히 예술적인 이유뿐만이 아닙니다. 페이지에 요소를 어디에 배치하느냐에 따라 의미를 전달할 수 있기 때문입니다. 황금 비율을 간단하게 적용한 것이 바로 ‘삼등분할 법칙’입니다. 이 법칙은 페이지를 가로세로로 3등분 하여 총 9개의 구획을 만들고, 이 선을 따라 또는 선이 교차하는 지점(이른바 ’파워 포인트’)에 중요한 요소를 배치하면 시각적으로 더 눈에 띄게 됩니다. 시선 추적 연구에 따르면 사람들은 이미지를 볼 때 이러한 선으로 표시된 영역에 시선이 더 오래 머무는 경향이 있다고 합니다.
’그리드’를 사용하여 레이아웃을 잡으면 내용의 크기나 배치를 대충 짐작하지 않아도 되므로 디자인 과정을 훨씬 쉽게 만들 수 있습니다. 작업을 시작하기 전에 파워포인트나 어도비 일러스트레이터 같은 프로그램에서 미리 안내선(가이드)을 전략적으로 배치해보세요. 그리드는 내용을 고정시켜 디자인 전체에 안정감을 주고, 슬라이드 간의 일관성을 만들어 독자들이 다음에 나올 내용이 어디쯤에 나타날지 예상할 수 있도록 돕습니다.
레이아웃은 단순히 그리드 선을 그리는 것이 아니라 독자의 시선이 어떤 경로로 움직이기를 원하는지 계획하는 과정입니다. 이는 내용의 중요도를 파악하여 무엇을 먼저 읽고 무엇을 나중에 읽을지 명확하게 보여주는 것입니다.
우리는 모든 자료에 똑같은 시각적 내용으로 가득 찬 슬라이드와 포스터를 종종 보게 됩니다. 이런 경우 어디서부터 읽어야 할지 알기 어렵습니다. 전설적인 그래픽 디자이너 폴 랜드는 “대비가 없으면 죽은 것이나 마찬가지다”라고 말했습니다. 이처럼 레이아웃은 그래픽 디자인의 기본이자 정보 이해에 큰 영향을 줍니다.
1.3 게슈탈트 이론
게슈탈트 이론은 사람들이 시각 정보를 어떻게 인식하고 정리하는지를 설명하기 위해 1920년대에 제안된 심리학 이론입니다. 독일어로 ‘형태’ 또는 ’형식’을 뜻하는 ’게슈탈트’는 우리가 개별적인 시각적 요소들을 모아 하나의 ’통합된 전체’로 인식하는 방식을 설명합니다.
게슈탈트는 부분과 전체의 상호작용을 강조합니다. 게슈탈트 심리학의 창시자 중 한 명인 쿠르트 코프카는 “전체는 부분의 합과는 다르다”고 말했습니다. 단순히 각 부분의 합을 넘어서는 새로운 의미가 창출된다는 점입니다. 이 이론의 핵심 개념은 그룹화입니다. 우리는 비슷하게 보이거나, 가까이 배치되거나, 선으로 연결되거나, 공통된 공간 안에 둘러싸인 객체들을 함께 속한 것으로 인식하는 경향이 있습니다. 이는 정보에 대한 맥락을 구축하는 강력한 방법입니다.
1.3.0.1 유사성 원리
유사성 원리는 우리가 시각적으로 비슷한 요소들을 한 그룹으로 묶어 인식하는 경향을 설명합니다. 즉, 색상, 크기, 모양 등이 비슷한 것들은 서로 관련이 있다고 생각하는 것이죠. 이 원리는 데이터 시각화에서 범주를 구분할 때 흔히 사용됩니다. 또한, 글꼴, 글꼴 크기, 방향, 여백과 같은 그래픽 처리 방식을 반복적으로 사용하여 문서 내의 요소들이 서로 더 관련 있어 보이도록 디자인할 수 있습니다.
1.3.0.2 근접성 원리
근접성 원리는 서로 가까이 배치된 객체들을 한 그룹으로 인식하는 경향을 말합니다. 이 원리는 그림 패널을 배열할 때 유용하게 적용됩니다. 예를 들어, 여러 개의 패널이 균일하게 떨어져 있을 때는 무엇을 기준으로 분석해야 할지 모호할 수 있습니다. 하지만 비교해야 할 패널들을 가깝게 배치하여 그룹화하면, 독자는 자연스럽게 그 관계를 파악하게 됩니다. 반대로, 패널을 순서대로 읽도록 유도하고 싶다면 한 줄로 배열하는 것이 효과적입니다.
1.3.0.3 연결성 및 폐쇄성 원리
연결성 원리는 선이나 다른 시각적 연결 고리로 이어진 객체들을 통합된 그룹으로 인식하는 경향입니다. 유사성이나 근접성으로 묶인 객체들이 느슨한 연합으로 보이는 반면, 선으로 연결하면 연결성 원리에 의해 객체들을 훨씬 더 강하게 연관되게 보입니다.
폐쇄성 원리는 공통된 영역 안에 요소들이 둘러싸여 있을 때 하나의 그룹으로 인식하는 경향을 말합니다. 이 원리는 유사성, 근접성, 심지어 연결성보다도 강력하게 객체들을 통합된 전체로 묶어줍니다.
1.3.0.4 시각적 완성 원리
시각적 완성(Visual Completion), 또는 시각적 보간(interpolation)은 실제로 존재하지 않는 윤곽선을 보게 되는 흥미로운 착시 현상을 만듭니다. 우리는 가능한 보이는 것에서 패턴을 찾으려는 경향이 있습니다. 따라서 우리는 프레젠테이션을 어지럽히는 불필요한 선, 상자, 글머리 기호 및 기타 그래픽 요소를 생략하여 깔끔하고 효과적인 디자인을 해야합니다.
1.3.0.5 연속성 원리
우리 눈은 작은 정렬 불일치에도 매우 민감합니다. 이것을 연속성(Continuity) 원리라고 합니다. 따라서 시각적 요소를 가이드에 맞춰 정렬하는 것이 보는 사람이 패턴을 식별하는 데 도움이 됩니다. 그래서 정렬 가이드를 사용하여 구성된 그림은 깔끔하고 전문적으로 보이게 됩니다.
1.4 여백(Negative Space): 디자인의 숨겨진 힘
여백(Negative Space)은 페이지의 여백뿐만 아니라 텍스트 블록, 이미지 사이의 간격등을 의미 합니다. 여백은 제목, 글, 그림만큼이나 디자인에 중요한 부분으로 디자인 요소들에게 숨 쉴 공간을 줄 뿐만 아니라 시각적 매력과 효과를 극적으로 향상시킬 수 있습니다.
1.4.1 여백의 중요성
과학자의 발표 자료는 대개 내용으로 빽빽하게 채워져 있습니다. 일부 사람은 여백이 불필요하다고 여기거나 심지어 페이지가 가득 채워지지 않는다고 불평하기도 합니다. 그러나 내용이 빽빽한 없는 슬라이드와 포스터는 여백이 불규칙하기 때문에 이해하기 어렵습니다.
1.4.2 효과적인 여백 넣기
이미지와 텍스트를 글자 그대로 또는 시각적으로 추상화된 ‘상자’ 안에 넣어서 레이아웃을 만드세요. 그러면 양의 공간과 음의 공간의 분포가 명확해집니다. 일반적인 팁을 주자면 섹션을 구분할 때 더 넓은 간격을 사용하고 섹션 내의 항목을 분리 할때는 더 얇은 간격을 사용하는 것입니다. 그리고 텍스트의 경우 글자 사이의 간격, 줄의 길이, 줄 사이의 간격을 조절해 추상화된 상자에 맞춥니다. 이런 방식의 여백은 독자에게 콘텐츠의 계층과 구성을 전달할 수 있습니다.
1.4.3 여백으로 시선 집중시키기
여백은 독자의 주의를 끄는 가장 효과적인 방법 중 하나입니다. 강조하고 싶은 콘텐츠를 상대적으로 더 많은 여백으로 둘러싸 보세요. 페이지의 해당 부분으로 시선을 이끌 것입니다.
1.5 중요한 부분 강조하기
두드러짐(Salience)은 객체를 주변 환경과 차별화시키는 속성입니다. 특히 슬라이드 프레젠테이션과 같은 시각 자료에서는 두드러짐과 정보의 관련성(relevance)이 일치하는지 확인하는 것이 필수적입니다. 청중이 내용을 동시에 듣고 읽는 상황이므로 정보 전달의 효율성이 무엇보다 중요하기 때문이죠.
예를 들어, 표의 특정 행이나 열에 색깔을 입히면 선택된 자료에 시선이 집중될 것입니다. 표 형식의 정보는 일반적으로 균일하게 보이기 때문에, 가장 중요한 것이 무엇인지 명확히 하는 것이 도움이 됩니다. 그래프에도 데이터의 특정 부분을 강조 구분을 하면 청중이 발표 내용과 시각 자료를 더 잘 이해하도록 돕는 방법이 될 수 있습니다.
1.5.1 의도치 않은 두드러짐의 위험
반대로 부주의하게 두드러짐을 남용하면 오히려 독자에게 잘못된 메세지를 줄 수 있습니다. 예를 들어 움직이는 이미지(예: 회전하는 3차원 단백질 구조)을 넣을 때는 주의해야 합니다. 왜냐하면 움직이는 이미지가 독자의 주의를 전부 집중시켜 다른 콘텐츠를 보지 못하게 합니다. 따라서 파워포인트 애니메이션은 신중하게 사용해야 하며, 움직이는 요소는 반드시 슬라이드의 주요 메시지를 뒷받침하는 콘텐츠여야 합니다.
동일한 콘텐츠도 어떻게 제시되느냐에 따라 이해도에 극적인 영향을 줍니다. 항상 화면에서 잠시 물러서서 무엇이 가장 두드러지는지 파악하려고 하세요. 그리고 가장 시각적으로 두드러지는 정보는 당신의 핵심 메시지여야 합니다.
1.5.2 효과적인 글쓰기 원칙을 그림 디자인에 적용하기
효과적인 글쓰기 원칙을 그림 디자인에 적용하면 어려움을 극복하고 체계적인 방식으로 시각 자료를 만들 수 있습니다. 마치 글의 단어 하나하나를 다듬듯이, 그림의 각 부분도 평가하고 최적화되야 합니다.
핵심 원칙:
명확성과 간결성: 복잡하고 이해하기 어려운 문장처럼 혼란스럽고 과도하게 꾸며진 그림(‘차트 잡동사니’)은 피해야 합니다. 번쩍이는 질감, 그라데이션, 불필요한 형태의 증식은 데이터를 해석하기 어렵게 만들고, 특정 부분을 강조하는 것을 방해하며 빈약한 데이터를 결코 구제할 수 없습니다.
평행 구조와 시각적 강조: 관련 아이디어를 시각적으로 강화하려면 ’평행 구조’를 사용하세요. 즉, 유사한 아이디어를 비슷한 시각적 형태로 표현하여 정보 간의 관계를 명확히 보여주세요. 중첩, 범주 계층, 중요성을 직관적으로 나타내는 모양과 색상을 선택하는 것이 중요합니다.
2 데이터 시각화에서 색상
2.1 색상의 선택
색상은 명확성을 더할 수 있는 강력한 도구이지만 잘못 사용하면 오히려 혼란을 초래하거나 잘못된 정보를 전달할 수 있습니다.
2.1.1 색상의 올바른 사용법
- 무지개색을 정량적 데이터에 사용하지 마세요. 무지개 색상은 그 자체로 순서에 대한 모호성이 있어 혼란을 줄 수 있습니다. 또한 특정 색상이 시각적으로 더 길거나 짧게 느껴지는 착시를 유발할 수 있습니다.
- 무지개색은 범주형 데이터에 사용하세요. 반면에 무지개색은 범주형 데이터(예: 실험 조건 구분)를 나타내는 데 효과적입니다.
- 색상 편향에 주의하세요. 특정 범주에 강렬하거나 약한 색상을 사용하면 독자에게 편향을 줄 수 있습니다. 구분 가능하면서도 시각적 가시성이 비슷한 색상을 선택하세요.
2.1.2 색상의 세 가지 속성과 활용법
모든 색상은 색조(hue), 채도(saturation), 명도(lightness)의 세 가지 속성으로 설명됩니다.
- 색조: 색상을 빨간색, 노란색 등으로 분류하는 속성입니다.
- 채도: 색상의 순수함, 예를 들면 흰색이 거의 없는 빨간색 물체는 채도가 매우 높다고 합니다.
- 명도: 색상의 밝기 또는 어둡기를 나타냅니다.
색상 선택 팁:
- 흑백으로 변환해도 구별 가능하도록 명도를 변화시키면서 색상환을 나선형으로 통과하는 색상을 선택하세요.
- 이러한 방식으로 6~8가지 색상 그룹을 정의하는 것이 이상적입니다. 그 이상은 독특한 색상을 선택하기 어려워집니다.
- 더 많은 범주를 표시해야 한다면 색상 외에 질감(texture)의 차이를 활용할 수 있습니다(예: 빨간색 십자가와 빨간색 원).
- 시각적 개체의 크기도 중요합니다. 개체가 작거나 선이 얇을수록 색조, 채도, 명도의 더 큰 변화가 필요합니다.
2.1.3 색맹을 고려한 색상 사용
적록 색맹(protanopia/deuteranopia)은 생각보다 많이 존재합니다. 따라서 색맹 독자에게도 적합한 색상을 선택하는 것이 좋습니다. 도구 활용: 소프트웨어를 사용하여 적록 색맹인 사람들에게 이미지가 어떻게 보일지 시뮬레이션해 볼 수 있습니다.
- Vischeck: 웹 기반 도구라 간편합니다.
- DanKam 앱 (iPhone/Android): 휴대폰 카메라로 들어오는 색상 스펙트럼을 색맹인 사람들이 볼 수 있는 범위 내로 이동시킵니다.
- eyePilot 및 Visolve Deflector를 사용하여 화면의 모든 색상을 조작할 수 있도록 합니다.
2.2 과한 색상 사용의 문제점
때로는 색상을 사용하지 않는 것이 더 나은 선택일 수 있습니다.
- 데이터 왜곡 및 편향: 색상이 잘못 사용되면 전혀 사용하지 않는 것보다 못할 수 있습니다. 색상이 잘못된 정보를 눈에 띄게 하거나, 의미 있는 정보를 보기 어렵게 만들 수 있기 때문입니다.
- 시각적 혼란: 과도한 색상 사용은 혼란을 야기해 수많은 요소들이 우리의 주의를 끌기 위해 경쟁하게 만듭니다.
2.3 정량적 데이터의 색상 고려사항
데이터를 시각화할 때 색상 사용은 매우 중요합니다. 특히 숫자 값을 가지는 정량적 데이터는 그 특성상 색상 매핑에 신중을 기해야 합니다. 데이터의 구조에 따라 색상 선택이 달라지며, 이는 전달하고자 하는 정보의 정확성과 명확성에 큰 영향을 미칩니다.
데이터를 시각화하기 위해 먼저 데이터에 내재적인 순서가 있는지 없는지를 구분해야 합니다. 예를 들어 박테리아 종 목록은 순서가 없는 ’범주형 데이터’입니다. 반면 유전자 발현 값은 낮은 값부터 높은 값까지 정렬할 수 있는 ’순서가 있는 데이터’로 분류됩니다. 이런 정량적 데이터에 적절한 색상 맵을 만드는 것이 중요합니다.
색상은 의료 영상부터 원형 차트에 이르기까지 데이터 표현에서 가장 중요한 시각적 요소 중 하나입니다. 색상의 세 가지 주요 구성 요소인 색조(hue), 채도(saturation), 명도(lightness)를 조절함으로써 색상은 레이블링, 수량 표시, 현실 표현 또는 시뮬레이션, 활성화 및 장식과 같은 다양한 기본적인 의사소통 요구를 충족시킬 수 있습니다.
정량적 데이터는 그 요소들이 수치적인 척도 위에 놓여 서로의 상대적인 위치와 크기를 나타낸다는 점에서 범주형 데이터와 다릅니다. 이러한 상호 관계 때문에 데이터의 범위와 크기 변화에 지각적으로 일관된 색상 맵을 설계하는 것이 중요합니다.
2.3.1 색상맵 고려사항
색상맵을 설계하기 전에 데이터에서 강조하고자 하는 주요 영역이나 지점을 먼저 정의해야 합니다.
양수 또는 음수 값만 있는 데이터: 데이터에 양수 값 또는 음수 값만 있는 경우, 순차적인 색상 맵을 사용하는 것이 직관적입니다. 이는 명도만 10%에서 90% 검정까지 변화시키는 방식입니다. 이러한 색상 진행은 전체 범위에 걸쳐 균일한 전환을 만듭니다. 색상 그라디언트의 끝을 0과 이론적 최대값에 매핑하거나 관찰된 최소값과 최대값에 매핑하는 두 가지 옵션이 있습니다. 후자의 접근 방식은 시각적 표현에서 더 높은 대비가 필요하고 0이 기준점으로 관련이 없을 때 유용합니다.
두 개 이상의 관심 영역을 포함하는 데이터: 데이터에 양수 및 음수 값이 모두 포함되어 분포의 하단과 상단 그리고 0을 구분해야 하는 경우, 분기형(diverging, 또는 양극성) 색상 스키마가 효과적입니다. 이 스키마는 색조와 채도를 모두 사용합니다. 색조는 양수와 음수 값을 구분하는 데 사용하고(예: 빨간색과 파란색), 채도는 상대적인 크기를 나타내는 데 사용하며, 채도가 높을수록 더 큰 크기의 값을 나타내고 채도가 없으면 0을 나타냅니다.
2.3.2 색상맵에 유용한 도구들
색상 전문 지식이 없는 사용자도 적절한 색상 맵을 선택하는 데 도움을 줍니다.
- 펜실베이니아 주립대학교의 ColorBrewer
- NASA의 Color Tool
3 데이터 그림의 요소
3.1 타이포그래피
타이포그래피는 글자를 배열하는 기술이자 예술입니다.
3.1.1 서체와 글꼴의 이해
서체(typeface)의 글자 형태는 세리프(serif)와 산세리프(sans serif)로 나뉩니다.
- 세리프 서체: 대체로 얇고 더 격식 있으며 ‘serif’ 부분이 눈이 줄을 따라가는 데 도움이 되므로 여러 줄의 텍스트 블록에서 읽기 쉽습니다.
- 산세리프 서체: 글자 형태가 더 단순하고 긴 텍스트에서는 가독성이 떨어진다고 주장하므로 제목이나 레이블과 같은 짧은 텍스트에 적합합니다. 일반적으로 슬라이드에는 산세리프 글꼴이 잘 어울리고 포스터나 인쇄물에는 세리프 글꼴이 적합합니다.
3.1.2 서체 선택의 원칙
가장 흔한 네 가지 서체는 Baskerville, Helvetica, Palatino, Times New Roman입니다. 제일 간단한 조언은 컴퓨터에 이 네 가지 서체를 설치하고 문서를 작성하라는 것입니다. 그렇게 하면 통일성을 가질 수 있으며 다른 컴퓨터에서 일관성있게 보여질 수 있을 것입니다. 물론 다양한 서체를 조합해 사용할 수 있지만 이는 세심한 주의와 기술을 요합니다.
3.1.3 간격 조정과 문서 구조화
타이포그래피는 문서의 분위기를 드러내고 텍스트의 구조와 의미를 명확히 할 수 있습니다. 또한 단어, 구문, 문장 및 텍스트 블록은 그들의 근본적인 의미에 따라 간격을 두어야 합니다. 단락 사이의 간격은 줄 사이의 간격보다 커야 하며, 목록 항목은 서로 관련되어 보이지만 인접 텍스트와는 분리되도록 간격을 두어야 합니다. 게슈탈트 원리에 따라 정렬되거나 서로 가까이 배치된 개체는 함께 속하는 것으로 인식됩니다.
의미 있는 간격을 가진 텍스트를 만들려면 ‘단락 앞 간격’ 및 ‘단락 뒤 간격’ 설정을 사용하세요. 이 설정은 글꼴 메뉴 > 단락
(파워포인트) 또는 서식 메뉴 > 단락
(워드)에서 찾을 수 있습니다. 예를 들어 단락 텍스트는 뒤에 5포인트 간격이 설정되고, 글머리 기호 목록은 뒤에 3포인트 간격이 설정될 수 있습니다. 또한 왼쪽 정렬된 텍스트는 들쭉날쭉한 오른쪽 가장자리를 남기는데 Shift + Enter
을 사용해 수동으로 줄을 끊으면 더 규칙적으로 만들 수 있습니다.
3.1.4 단순함과 통일성의 미덕
대부분의 문서는 하나의 서체를 사용하고 최대 두세 가지 글자 크기로 볼드체와 이탤릭체를 적절히 사용하면 완벽하게 작성할 수 있습니다. 이렇게 글꼴과 글꼴 처리의 변화를 제한함으로써 슬라이드나 포스터에 제시될 시각 정보의 구성을 통일할 수 있습니다. 통일된 타이포그래피 요소들이 문서를 더 읽기 쉽게 만듭니다.
3.1.5 축
데이터에 좌표 시스템이 있다면 그림의 축은 독자의 방향을 잡아주는 기반이자 핵심입니다.
- 축의 두께: 축의 두께는 적당해야 합니다. 0.5pt면 충분하며 그림이 특별히 크지 않다면 사방을 축으로 둘러싸는 것을 피해야 합니다.
- 화살표 사용 지양: 축에 화살표를 배치하는 것을 자제하세요. 축의 방향은 거의 의심할 여지가 없습니다.
- 다중 패널 그림의 스케일: 다중 패널 그림은 가능한 한 고정된 스케일을 유지해 비교하기 쉬워야 합니다.
3.1.6 눈금
눈금이 너무 빽빽하게 있으면 가독성이 떨어집니다.
3.1.7 그리드
그리드는 비율을 비교하고 위치를 축 눈금과 연관시키는 시선(sight lines)으로 사용됩니다. 궁극적으로는 잘못된 그리드보다 그리드가 없는 것이 나을 수도 있습니다. 그리드는 기본적으로 사용하기보다는 필요할 때만 사용하세요.
3.1.8 레이블
그림의 레이블은 하나의 고정된 크기를 사용하고, 게슈탈트 원리에 따라 하나의 그룹으로 정렬되야 합니다. 또한 레이블의 내용은 간결하지만 명확해야 합니다.
3.2 심볼: 명확하고 의미 있는 데이터 표현
데이터 포인트 심볼은 산점도(scatter plot)에서 시각적인 패턴과 변수 간의 관계를 파악하는 데 도움이 됩니다. 잘 선택된 심볼은 데이터 가려짐(occlusion)을 줄이고 다양한 데이터 범주의 시각적 독립성을 유지하는 데 도움이 됩니다.
3.2.1 단일 데이터 범주에서의 심볼
단일 데이터 범주를 가진 플롯에서는 겹치는 심볼로 인해 발생하는 데이터 가려짐을 최소화하는 것이 가장 중요합니다. 이 경우 속이 빈 원이 최선의 선택입니다. 다른 일반적인 기하학적 모양(사각형, 삼각형, 마름모 등)과 달리, 원은 다른 원과 교차되도 새로운 원을 만들지 않습니다. 그리고 속이 빈 형태의 장점은 겹치는 부분이 페이지에 더 밀도 높은 잉크 영역을 만들어 실용적인 밀도 맵을 대체할 수 있습니다.
3.2.2 다중 데이터 범주에서의 심볼
여러 데이터 범주는 강력한 시각적 경계를 형성하는 뚜렷한 심볼로 인코딩되어야 합니다. 모양이 유사한 심볼은 특히 심볼이 겹치는 영역에서 데이터를 식별하기 어려울 수 있습니다.
데이터 범주 간에 명확하고 간단한 구별하는 방법은 범주 이름의 첫 글자를 플로팅 심볼로 사용하는 것입니다. 이 방법은 글자가 시각적으로 뚜렷하다면(예: H, Q, X) 독자가 범례를 반복해 확인할 필요가 없어 해석을 더 쉽게 만듭니다.
사용 가능하다면 색상은 매우 효과적인 구분자입니다. 그러나 색조의 수가 증가함에 따라 그 중요성이 감소하므로 신중하게 사용해야 합니다. 데이터 범주에 대한 좋은 색상 선택은 정성적 브루어 팔레트에서 찾을 수 있습니다.
3.2.3 데이터 구조 반영
종종 데이터 포인트들은 계층 구조를 가집니다. 예를 들어 유전자의 상태(‘끔’ 또는 ‘켬’)에 따라 분류된 데이터는 구별하고 부각시키기 위해 시각적 비중(채움 및/또는 색상)을 가진 심볼을 사용하여 중요성을 나타낼 수 있습니다. 특히 관련성이 낮은 데이터(예: 맥락을 위해 포함된 참조 데이터)에는 덜 눈에 띄는 심볼을 사용하는 것이 좋습니다.
3.2.4 심볼 수가 많을 때의 대처
심볼의 수가 많으면 구별하기 어렵습니다. 플롯에 6-7개 이상의 범주가 있다면 스몰 멀티플(small multiples)을 사용해 여러 패널로 데이터를 제시하는 것을 고려하세요.
3.3 화살표
화살표는 가장 흔히 사용되는 그래픽 요소 중 하나입니다. 화살표는 복잡한 정보를 안내하는 매우 효율적인 시각적 의사소통 도구로 사용됩니다. 분자 생물학에서 화살표 관련 관례가 몇가지 있습니다. 예를 들어, 직각 선분과 함께 있는 화살표는 전사 시작 지점 또는 프로모터, 선과 평행하게 배치된 짧은 화살표는 일반적으로 PCR 프라이머를 나타냅니다.
3.3.1 화살표 사용 주의점
화살표는 요소 자체보다는 요소 간의 기능적 관계에 주의를 집중시키는 데 가장 효과적으로 사용됩니다. 따라서 방향이나 순서를 나타내는 데 화살표를 사용하고 시스템의 구조등의 공간적 상호 관계를 강조하려면 요소를 연결할때 화살표 대신 선을 사용해야 합니다. 한 가지 예외는 현미경 사진이나 기타 영상에서 두드러진 특징을 나타내는 데는 일반적으로 화살표를 사용합니다.
내용을 계속 추가하는 중입니다.
Footnotes
https://blogs.nature.com/methagora/2013/07/data-visualization-points-of-view.html↩︎