Skip to main content

Low-Level Envy

Paul Graham이 쓴 Hackers and Painters라는 글을 보면 math envy라는 말이 나옵니다. 과학계에 있는 사람들은 속으로 수학자들이 자신들보다 똑똑하다고 믿는 것을 두고 나온 말입니다. 이런 생각의 결과로 자신의 작업을 되도록이면 수학적으로 보이려고 애쓰게 되는데 물리학같은 과학에선 이런 현상이 별 해가 없지만 자연과학에서 멀어질수록 문제를 발생시킬 수 있습니다. 정말 중요한 문제보단 수학적으로 보일 수 있는 문제를 풀려는 유혹이 강해진다는 것이죠.

제 생각에 개발자들에게 또 하나의 envy가 있다면 low-level envy가 아닐까 합니다. C++를 알다보면 컴파일러의 구현 방법에 대해 알고 싶어집니다. 표준 라이브러리를 사용하다보면 이 함수는 어떤 시스템 콜을 사용하는지 궁금해지고요. 다음으론 그 시스템 콜은 커널에서 어떻게 동작하는지, 커널이나 디바이스 드라이버는 어떻게 구현되는지, 하드웨어와는 어떻게 인터페이스하는지, CPU는 한 명령어를 어떻게 처리하는지, 캐시는 어떻게 사용되는지 등등.

사실 이런 low-level envy는 math envy와는 달리 실제 프로그래밍 작업에 많은 도움이 됩니다. 실제 지난 글에서 살펴봤던 pure virtual function called와 같은 에러는 컴파일러가 vtbl과 vptr를 어떻게 구현하는지를 몰랐다면 원인을 찾기가 어려웠을 것입니다. 다른 예로 시스템의 메모리는 남아 있는데 왜 더 이상 쓰레드 생성이 안되는지와 같은 에러의 원인을 알려면 커널이 어떻게 쓰레드를 구현하고 있는지를 알고 있어야 할 것입니다. C++ and the Perils of Double-Checked Locking과 같은 문제점을 찾으려면 sequence point라는 개념과 컴파일러와 CPU에 의한 최적화 방법들까지 어느 정도 알고 있어야 합니다.

이런 low-level의 지식들은 날마다 필요한 것들은 아닙니다. 하지만 진짜 어려운 문제를 만났을 때 그것을 해결할 수 있느냐 없느냐의 차이를 가져옵니다.

이런 문제가 가장 많이 발생하는 곳이 바로 multi-threading쪽이 아닐까 합니다.

이 문제가 어려운 이유는 재현이 어렵다는 것이죠. 따라서 일반적인 디버깅과 같이 trial and error 방법을 써서 문제를 풀기가 어렵습니다. 이런 문제는 꼼꼼한 code inspection과 알고 있는 지식을 가지고 정확히 문제가 되는 코드를 찾아야 합니다. 주로 lock이 있어야 할 곳에 없거나 locking의 범위에 몇 라인이 빠졌다거나 하는 문제입니다만 multi-threading의 원리를 이해하지 못하고 있으면 원인을 찾지 못하거나 "printf를 한 줄 넣었더니 잘 되요"나 "debugging 옵션으로 컴파일하니 문제가 없어져요"와 같은 엉뚱한 결론을 내리게 됩니다.

저 역시 항상 좀 더 low-level을 알고자 하는 욕심이 있어서 리눅스 커널 관련 서적을 몇권 읽었습니다. 하드웨어에 관해선 학교 다닐때 수업시간에 들은게 다입니다만 항상 관심을 가지고 있고요. ((art.oriented사이트에서 가끔 재밌는 글을 읽게 됩니다. 얼마전에도 false sharing에 대한 글이 올라 왔었죠. Monaca사이트도 등록해 놓고 읽고 있습니다. 여긴 가끔 프로그래밍 이외의 강한 어조의 글들이 올라옵니다. :-| ))

얼마전에 회사에서 시켜주는 교육중에 임베디드 리눅스 프로그래밍이란 것이 있길래 냉큼 신청해서 들었습니다. 여태까진 임베디드 시스템이라고 해도 거의 PC 수준의 시스템이었기 때문에 항상 진짜 임베디드 시스템 프로그래밍이란 어떤 것인지 궁금했는데 (몰라서 불안했는데) 부트로더나 커널 포팅에 대해 배우고 나니 많은 도움이 되었습니다. (좀 안심이 되더군요.) 일단 커널 포팅이 되고 나니 다음은 거의 하드웨어 스펙 보기나 애플리케이션 레벨의 프로그래밍이 되어 좀 지루해지긴 했습니다만... :-)

훌륭한 개발자의 조건은 무엇보다 호기심인 것 같습니다. 모르는 것이 생겼을 때 궁금해서 못 견디는 그런 호기심 말이죠. :-)

.

덧) 한가지 문제는 low-level envy뿐 아니라 high-level envy도 있다는 것입니다. 코딩만 하다보면 설계 방법도 배워야 되고, 디자인 패턴, 리팩토링, UML에 각종 methodology까지... 제가 요새 읽고 있는 책은 Fit for Developing Software. :-|

Comments

  1. low-level envy, 멋진 표현입니다. 호기심이 중요하다는 말이 무척 와닿습니다. 호기심이 많을수록 low-level envy가 많이 생기는 것 같더라구요.

    ReplyDelete

Post a Comment

Popular posts from this blog

1의 개수 세기 - 해답

벌써 어제 말한 내일이 되었는데 답을 주신 분이 아무도 없어서 좀 뻘쭘하네요. :-P 그리고 어제 문제에 O(1)이라고 적었는데 엄밀히 얘기하자면 O(log 10 n)이라고 적었어야 했네요. 죄송합니다. ... 문제를 잠시 생각해보면 1~n까지의 수들 중 1의 개수를 얻기 위해서는 해당 숫자 n의 각 자리의 1의 개수가 모두 몇개나 될지를 구해서 더하면 된다는 사실을 알 수 있습니다. 예를 들어 13이라는 수를 생각해 보면 1~13까지의 수에서 1의 자리에는 1이 모두 몇개나 되는지와 10의 자리에는 모두 몇개나 되는지를 구해 이 값을 더하면 됩니다. 먼저 1의 자리를 생각해 보면 1, 11의 두 개가 있으며 10의 자리의 경우, 10, 11, 12, 13의 네 개가 있습니다. 따라서 2+4=6이라는 값을 구할 수 있습니다. 이번엔 234라는 수에서 10의 자리를 예로 들어 살펴 보겠습니다. 1~234라는 수들 중 10의 자리에 1이 들어가는 수는 10, 11, ..., 19, 110, 111, ... 119, 210, 211, ..., 219들로 모두 30개가 있음을 알 수 있습니다. 이 규칙들을 보면 해당 자리수의 1의 개수를 구하는 공식을 만들 수 있습니다. 234의 10의 자리에 해당하는 1의 개수는 ((234/100)+1)*10이 됩니다. 여기서 +1은 해당 자리수의 수가 0이 아닌 경우에만 더해집니다. 예를 들어 204라면 ((204/100)+0)*10으로 30개가 아닌 20개가 됩니다. 이런 방식으로 234의 각 자리수의 1의 개수를 구하면 1의 자리에 해당하는 1의 개수는 ((234/10)+1)*1=24개가 되고 100의 자리에 해당하는 개수는 ((234/1000)+1)*100=100이 됩니다. 이들 세 수를 모두 합하면 24+30+100=154개가 됩니다. 한가지 추가로 생각해야 할 점은 제일 큰 자리의 수가 1인 경우 위의 공식이 아닌 다른 공식이 필요하다는 점입니다. 예를 들어 123에서 100의 자리에 해당하는 1의 개수는 ((123/1...

CodeHighlighter plugin test page.

This post is for testing CodeHighlighter plugin which uses GeSHi as a fontifier engine. ((Those code blocks are acquired from Google Code Search .)) ((For more supported languages, go CodeHighlighter plugin or GeSHi homepage.)) C++ (<pre lang="cpp" lineno="1">) class nsScannerBufferList { public: /** * Buffer objects are directly followed by a data segment. The start * of the data segment is determined by increment the |this| pointer * by 1 unit. */ class Buffer : public PRCList { public: Buffer() { ++index_; } PHP (<pre lang="php" lineno="4">) for ($i = 0; $i $value = ord( $utf8_string[ $i ] ); if ( $value < 128 ) { // ASCII $unicode .= chr($value); } else { if ( count( $values ) == 0 ) { $num_octets = ( $value } $values[] = $value; Lisp (<pre lang="lisp">) ;;; Assignment (define-caller-pattern setq ((:star var fo...

std::map에 insert하기

얼마전 회사 동료가 refactoring한 코드를 열심히 revert하고 있어서 물어보니 다음과 같은 문제였습니다. 원래 코드와 refactoring한 코드는 다음과 같더군요. nvp[name] = value; // original code nvp.insert(make_pair(name, value)); // refactored 아시겠지만 위의 두 라인은 전혀 다른 기능을 하죠. C++03에 보면 각각 다음과 같이 설명되어 있습니다. 23.1.2/7 Associative containers a_uniq.insert(t): pair<iterator, bool> inserts t if and only if there is no element in the container with key equivalent to the key of t. The bool component of the returned pair indicates whether the insertion takes place and the iterator component of the pair points to the element with key equivalent to the key of t. 23.3.1.2/1 map element access [lib.map.access] T& operator[](const key_type& x); Returns: (*((insert(make_pair(x, T()))).first)).second. 원래 코드는 매번 새 값으로 이전 값을 overwrite했지만 새 코드는 이전에 키가 존재하면 새값으로 overwrite하지 않습니다. 따라서 원래 기능이 제대로 동작하지 않게 된것이죠. 그래서 물어봤죠. "왜 이렇게 했어?" "insert가 성능이 더 좋다 그래서 했지." :-? 사실 Fowler 아저씨는 Refactoring 책에서 refactoring은 성능을 optimizing하기 위한 것이 아니다라...