Skip to main content

C++ of the Day #36 - Polymorphic Predicate

오랫만에 올리는 C++ of the Day입니다. :-)

Question



파일 리스트를 필터링하는 기능을 구현하려고 합니다. 필터링에는 다수의 필터가 사용되며 따라서 다음과 같이 구현하려고 합니다. ((이번 글은 STL algorithm member function problem을 가지고 작성되었습니다.))


struct Rule : std::unary_function {
virtual result_type operator()(const argument_type&) const = 0;
};

// concrete rules are inherited from the Rule class and define the operator()

typedef boost::shared_ptr RulePtr;

vector filelist;
// ... fill filelist with a series of file names ...

for(vector::iterator iter = rules.begin(); iter != rules.end(); ++iter) {
// This is the problem line...
remove_if(fileList.begin(), fileList.end(), ??);
}


이 기능을 제대로 구현하려면 어떻게 수정해야 할까요?

Answer



위의 코드는 크게 두가지 문제가 있습니다. 첫째는 remove_if함수의 선언을 보면 알 수 있습니다.


template
ForwardIterator remove_if(ForwardIterator first, ForwardIterator last, Predicate pred);


여기서 Predicate의 model은 결국 Assignable임을 알 수 있습니다. 따라서 ?? 부분을 **iter와 같이 할 경우 remove_if의 Predicate template parameter는 Rule로 instantiation되며 Rule 클래스는 pure virtual로 Assignable하지 않으므로 에러가 발생합니다.

이를 방지하기 위해 Rule 클래스의 operator()를 다음과 같이 pure virtual이 아닌 default 구현을 제공하는 것으로 바꾼다면 어떻게 될까요?


struct Rule : std::unary_function {
virtual result_type operator()(const argument_type&) const {
return true;
}
};


이 경우, 컴파일은 성공하나 틀린 결과가 나오게 됩니다. remove_if 함수안으로 Rule 클래스로 assign되면서 object slicing이 발생하기 때문입니다.

두번째 문제는 remove_if는 실제로 container안의 element들을 remove하지 못합니다. ((자세한 내용은 Effective STL의 Item 9. Choose carefully among erasing options을 참고하세요.)) 한쌍의 iterator만으론 이런 작업을 할 수 없기 때문이죠. 따라서 remove_if는 지워야 할 element들을 모두 뒤로 모은 다음 지워야 할 element들의 begin, 즉, 지워지지 않은 element들의 end를 리턴합니다.

그럼 이 두가지 문제를 수정해 볼까요? 제가 사용한 방법은 다음과 같습니다. 먼저 다음과 같이 간단한 RuleWrapper 클래스를 구현합니다. ((이 방법은 letter/envelope idiom이라고 할 수 있겠네요.))


class RuleWrap : public std::unary_function
{
public:
RuleWrap(boost::shared_ptr impl) : impl_(impl) {
}
result_type operator()(const argument_type& arg) const {
return (*impl_)(arg);
}
private:
boost::shared_ptr impl_;
};


boost::shared_ptr가 Assignable하기 때문에 이 클래스 역시 Assignable하게 되며 따라서 remove_if 안에서 사용이 가능합니다. 또한 slicing도 발생하지 않지요.

그리고 remove_if에서 다음 필터를 위해 사용될 end는 이전 remove_if에서 리턴된 iterator를 사용함으로써 두번째 문제를 해결할 수 있습니다. 다음 코드를 보세요.


typedef boost::shared_ptr RulePtr;

rules.push_back(RuleWrap(boost::shared_ptr(new ConcreteRule)));
...

vector filelist;
// ... fill filelist with a series of file names ...

vector::iterator last = filelist.end();

for(vector::iterator iter = rules.begin(); iter != rules.end(); ++iter) {
// This is the problem line...
last = remove_if(fileList.begin(), last, *iter);
}



이제 filelist.begin()과 last 사이에 필터링된 파일 리스트가 들어 있습니다. 실제로 filelist에서 필터링에서 걸러진 element들을 삭제하려면 다음과 같이 vector의 erase() 함수를 사용하면 됩니다.


filelist.erase(last, filelist.end());


h2. Answer of the Boost Era

여기까지가 pre-boost 시대의 해결책이라고 한다면 이제 boost 시대의 방법을 알아보죠.

이제 Rule base class나 RuleWrap같은 방법은 모두 필요 없습니다. 우리에겐 boost::function이 있기 때문이죠. :-)


typedef vector > Rules_t;
Rules_t rules;

rules.push_back(ConcreteRule());

// filtering
vector::iterator last = filelist.end();

for(Rules_t::iterator iter = rules.begin();
iter != rules.end(); ++iter)
{
last = remove_if(filelist.begin(), last, *iter)
}

filelist.erase(last, filelist.end());


물론 이 경우에 Rule들은 반드시 functor여야 할 필요가 없습니다. 일반 함수 포인터나 심지어 멤버 function도 가능하죠.

이 방법외에 이전에 구현해 보았던 dynamic_visitor나 mpl 라이브러리를 사용하는 방법, boost::bind를 사용하는 방법등이 있겠으나 여기선 boost::function이 가장 적당한 방법이라 생각되네요. :-)

Comments

Popular posts from this blog

1의 개수 세기 - 해답

벌써 어제 말한 내일이 되었는데 답을 주신 분이 아무도 없어서 좀 뻘쭘하네요. :-P 그리고 어제 문제에 O(1)이라고 적었는데 엄밀히 얘기하자면 O(log 10 n)이라고 적었어야 했네요. 죄송합니다. ... 문제를 잠시 생각해보면 1~n까지의 수들 중 1의 개수를 얻기 위해서는 해당 숫자 n의 각 자리의 1의 개수가 모두 몇개나 될지를 구해서 더하면 된다는 사실을 알 수 있습니다. 예를 들어 13이라는 수를 생각해 보면 1~13까지의 수에서 1의 자리에는 1이 모두 몇개나 되는지와 10의 자리에는 모두 몇개나 되는지를 구해 이 값을 더하면 됩니다. 먼저 1의 자리를 생각해 보면 1, 11의 두 개가 있으며 10의 자리의 경우, 10, 11, 12, 13의 네 개가 있습니다. 따라서 2+4=6이라는 값을 구할 수 있습니다. 이번엔 234라는 수에서 10의 자리를 예로 들어 살펴 보겠습니다. 1~234라는 수들 중 10의 자리에 1이 들어가는 수는 10, 11, ..., 19, 110, 111, ... 119, 210, 211, ..., 219들로 모두 30개가 있음을 알 수 있습니다. 이 규칙들을 보면 해당 자리수의 1의 개수를 구하는 공식을 만들 수 있습니다. 234의 10의 자리에 해당하는 1의 개수는 ((234/100)+1)*10이 됩니다. 여기서 +1은 해당 자리수의 수가 0이 아닌 경우에만 더해집니다. 예를 들어 204라면 ((204/100)+0)*10으로 30개가 아닌 20개가 됩니다. 이런 방식으로 234의 각 자리수의 1의 개수를 구하면 1의 자리에 해당하는 1의 개수는 ((234/10)+1)*1=24개가 되고 100의 자리에 해당하는 개수는 ((234/1000)+1)*100=100이 됩니다. 이들 세 수를 모두 합하면 24+30+100=154개가 됩니다. 한가지 추가로 생각해야 할 점은 제일 큰 자리의 수가 1인 경우 위의 공식이 아닌 다른 공식이 필요하다는 점입니다. 예를 들어 123에서 100의 자리에 해당하는 1의 개수는 ((123/1...

CodeHighlighter plugin test page.

This post is for testing CodeHighlighter plugin which uses GeSHi as a fontifier engine. ((Those code blocks are acquired from Google Code Search .)) ((For more supported languages, go CodeHighlighter plugin or GeSHi homepage.)) C++ (<pre lang="cpp" lineno="1">) class nsScannerBufferList { public: /** * Buffer objects are directly followed by a data segment. The start * of the data segment is determined by increment the |this| pointer * by 1 unit. */ class Buffer : public PRCList { public: Buffer() { ++index_; } PHP (<pre lang="php" lineno="4">) for ($i = 0; $i $value = ord( $utf8_string[ $i ] ); if ( $value < 128 ) { // ASCII $unicode .= chr($value); } else { if ( count( $values ) == 0 ) { $num_octets = ( $value } $values[] = $value; Lisp (<pre lang="lisp">) ;;; Assignment (define-caller-pattern setq ((:star var fo...

Coverity Prevent - 소스 코드 검사 도구

이번에 회사에서 소스 코드 검사 도구를 하나 구입하는데 이것저것 비교해본 결과 Coverity Prevent 라는 툴이 가장 좋아 이걸로 결정했다고 하더군요. 간단히 말하자면 Lint 처럼 소스 코드에 대해 static analysis를 하는 도구입니다. 그래서 시험삼아 돌려본 결과를 보게 되었는데 그 품질이 정말 놀랍군요. 메모리 릭이나 초기화하지 않은 변수, 버퍼 오버런, null 체크등등 거의 정확하게 에러를 보고해 줍니다. 다음은 전체 코드에서 발견된 문제점들을 리스트 형태로 보여주는 화면입니다. 정말 많군요. ;-) 다음은 이중 하나의 에러를 자세히 보기 위해 선택하여 들어간 화면입니다. 소스 코드에 라인번호와 에러가 발생한 위치, 에러가 발생할 수 있는 조건들을 자세히 보여줍니다. 정말 '와우!'입니다. 각 함수와 같은 이름들을 클릭하면 그 함수로 바로 이동할 수 있습니다. 사용해보니 개인적으로는 purify 같은 runtime 검사 도구보다 더 맘에 드는군요. 사실 Lint 계열의 도구들은 한번도 사용해본 적이 없는데 다른 것들도 한번 구해다 써봐야겠습니다. 이 툴의 유일한 문제는 비싸다는 것이랍니다. :-)