Skip to main content

C++ of the Day #28 - random_number_iterator 구현

원래는 지난번 글로 Boost::Iterator 라이브러리 얘기를 마치려고 했는데 읽던 책에 random number generator에 관한 내용이 나오네요. ((The C++ Standard Library Extensions: A Tutorial and Reference, Pete Becker, Addison-Wesley Professional, 2006))

이 내용을 이용하여 random_number_iterator를 만들어 보았습니다. random number generator는 tr1에 있으나 같은 내용이 boost에도 있으므로 boost 라이브러리를 사용하였습니다.

먼저 random number generator는 여러가지 random number 생성을 해주는 engine들과 이들 engine을 결합하여 다른 엔진을 만들어 주는 compound engine, 그리고 이를 사용하는 각종 distribution 및 engine과 distribution을 결합해 주는 variate_generator등으로 구성되어 있습니다. 또한 기본 engine들에 적당한 default 값을 사용한 predefine된 타입도 제공합니다.
boost::mt19937 rng;
boost::uniform_int<> six(1,6);
boost::variate_generator<boost::mt19937&, boost::uniform_int<> > die(rng, six);

int x = die();
예를 들어 위의 코드에서 mt19937은 mersenne_twister라는 engine을 사용하여 predefined된 타입입니다. ((Boost Random Number Library 문서에서 가져왔습니다.)) 그리고 uniform_int는 어떤 random number의 sequence를 특정 범위안의 uniformly distributed random sequence로 변경해 주는 클래스이고 마지막으로 variate_generator는 engine과 distribution을 결합시키기 위해 사용되었습니다.

이렇게 해서 생성된 die 객체는 function call operator를 가지고 있어 마지막 라인과 같이 호출할 때마다 새로운 1~6의 범위안에서 uniformly distributed된 random number를 리턴합니다. 즉, 정육면체 주사위를 simulate할 수 있는 객체죠.

이 function call operator를 사용하여 특정 container의 값을 채우기 위한 방법에는 다음과 같은 것들이 있습니다.
for (int i = 0; i < vi.size(); ++i) vi[i] = die();

std::generate(vi.begin(), vi.end(), die);

std::generate_n(vi.begin(), vi.size(), die);
하지만 이번 글에서 만들어 볼 iterator 클래스를 사용하면 다음과 같이 사용이 가능합니다.
random_number_iterator<??> first(die, N);
random_number_iterator<??> last(die);
copy(first, last, vi.begin());
여기서 N은 이 iterator가 만들어 낼 random number의 갯수입니다. 그리고 ?? 부분에 대해서는 뒤에서 알아 보겠습니다.

그럼 Boost::Iterator에 대한 설명을 생략하고 바로 코드를 보겠습니다.
template <class Gen>
class random_number_iterator
  : public boost::iterator_facade<
      random_number_iterator<gen>,
      typename Gen::result_type const,
      forward_traversal_tag
    >
{
  typedef typename Gen::result_type result_type;
public:
  explicit random_number_iterator(Gen& gen, int cnt = 0)
      : gen_(gen), cnt_(cnt) {
    if (cnt != 0) val_ = gen_();
  }

private:
  friend class boost::iterator_core_access;

  void increment() { --cnt_; val_ = gen_(); }

  bool equal(random_number_iterator const& other) const
  {
    return cnt_ == other.cnt_;
  }

  result_type const& dereference() const { return val_; }

private:
  Gen& gen_;
  int cnt_;
  result_type val_;
};
cnt_ 멤버는 default로 0으로 셋팅되어 iterator의 end()를 나타내게 됩니다. 0이 아닌 값은 end()가 아니며 increment() 호출시마다 1씩 감소하여 결국 end()가 되도록 만들었습니다. 그리고 이 increment()시에 gen_()을 호출하여 random number를 val_에다 저장하도록 하였습니다.

여기서 만약 val_ 멤버 변수를 없애기 위해 dereference()마다 gen_()을 호출하였다면 아래와 같은 코드에서 i와 j는 서로 다른 값을 가지는 문제가 생기게 됩니다.
i = *iter;
j = *iter;
다음으로 주의할 점은 생성자에서 cnt_가 0이면 val_의 초기값을 셋팅하지 않는다는 것입니다. 물론 end()를 dereference하는 것은 금지되어 있어 사용자가 호출하진 않겠지만 만약 여기서 gen_()을 호출한다면 reference로 가지고 있는 gen_의 상태가 변하게 되고 역시 이 reference를 가지고 있을 다른 iterator의 상태에 영향을 주기 때문입니다.

그럼 이제 이 iterator를 사용하여 앞에서 살펴본 ?? 를 가지고 있던 코드를 다시 작성해 보겠습니다.
random_number_iterator<variate_generator<boost::mt19937&, boost::uniform_int<> > > first(die, N);
random_number_iterator<variate_generator<boost::mt19937&, boost::uniform_int<> > > last(die);
copy(first, last, vi.begin());
너무 길군요. :-| 그럼 이를 좀 간단히 해줄 helper function을 만들어 보겠습니다.
template <class Gen>
random_number_iterator<gen> make_random_number_iterator(Gen& gen, int cnt = 0)
{
return random_number_iterator<gen>(gen, cnt);
}
이제 이 function을 사용하여 다음과 같이 코드를 작성할 수 있습니다.
copy(
make_random_number_iterator(die, N),
make_random_number_iterator(die),
vi.begin());
이제 실제 타입이 아무리 길어도 위의 함수를 사용하여 비교적 간단히 algorithm들을 사용할 수 있게 되었습니다.

참고로 C++에 auto 키워드가 추가되고 나면 다음과 같이 작성할 수 있게 됩니다.
auto first = make_random_number_iterator(die, N),
auto last = make_random_number_iterator(die),
copy(first, last, vi.begin());
이번 글에서는 Boost::Iterator 시리즈의 복습 삼아 random_number_iterator를 작성해 보았습니다. 해보면서 느끼는 건데 iterator 만들기 정말 쉬워졌군요. :-)

Comments

Popular posts from this blog

1의 개수 세기 - 해답

벌써 어제 말한 내일이 되었는데 답을 주신 분이 아무도 없어서 좀 뻘쭘하네요. :-P 그리고 어제 문제에 O(1)이라고 적었는데 엄밀히 얘기하자면 O(log 10 n)이라고 적었어야 했네요. 죄송합니다. ... 문제를 잠시 생각해보면 1~n까지의 수들 중 1의 개수를 얻기 위해서는 해당 숫자 n의 각 자리의 1의 개수가 모두 몇개나 될지를 구해서 더하면 된다는 사실을 알 수 있습니다. 예를 들어 13이라는 수를 생각해 보면 1~13까지의 수에서 1의 자리에는 1이 모두 몇개나 되는지와 10의 자리에는 모두 몇개나 되는지를 구해 이 값을 더하면 됩니다. 먼저 1의 자리를 생각해 보면 1, 11의 두 개가 있으며 10의 자리의 경우, 10, 11, 12, 13의 네 개가 있습니다. 따라서 2+4=6이라는 값을 구할 수 있습니다. 이번엔 234라는 수에서 10의 자리를 예로 들어 살펴 보겠습니다. 1~234라는 수들 중 10의 자리에 1이 들어가는 수는 10, 11, ..., 19, 110, 111, ... 119, 210, 211, ..., 219들로 모두 30개가 있음을 알 수 있습니다. 이 규칙들을 보면 해당 자리수의 1의 개수를 구하는 공식을 만들 수 있습니다. 234의 10의 자리에 해당하는 1의 개수는 ((234/100)+1)*10이 됩니다. 여기서 +1은 해당 자리수의 수가 0이 아닌 경우에만 더해집니다. 예를 들어 204라면 ((204/100)+0)*10으로 30개가 아닌 20개가 됩니다. 이런 방식으로 234의 각 자리수의 1의 개수를 구하면 1의 자리에 해당하는 1의 개수는 ((234/10)+1)*1=24개가 되고 100의 자리에 해당하는 개수는 ((234/1000)+1)*100=100이 됩니다. 이들 세 수를 모두 합하면 24+30+100=154개가 됩니다. 한가지 추가로 생각해야 할 점은 제일 큰 자리의 수가 1인 경우 위의 공식이 아닌 다른 공식이 필요하다는 점입니다. 예를 들어 123에서 100의 자리에 해당하는 1의 개수는 ((123/1...

CodeHighlighter plugin test page.

This post is for testing CodeHighlighter plugin which uses GeSHi as a fontifier engine. ((Those code blocks are acquired from Google Code Search .)) ((For more supported languages, go CodeHighlighter plugin or GeSHi homepage.)) C++ (<pre lang="cpp" lineno="1">) class nsScannerBufferList { public: /** * Buffer objects are directly followed by a data segment. The start * of the data segment is determined by increment the |this| pointer * by 1 unit. */ class Buffer : public PRCList { public: Buffer() { ++index_; } PHP (<pre lang="php" lineno="4">) for ($i = 0; $i $value = ord( $utf8_string[ $i ] ); if ( $value < 128 ) { // ASCII $unicode .= chr($value); } else { if ( count( $values ) == 0 ) { $num_octets = ( $value } $values[] = $value; Lisp (<pre lang="lisp">) ;;; Assignment (define-caller-pattern setq ((:star var fo...

std::map에 insert하기

얼마전 회사 동료가 refactoring한 코드를 열심히 revert하고 있어서 물어보니 다음과 같은 문제였습니다. 원래 코드와 refactoring한 코드는 다음과 같더군요. nvp[name] = value; // original code nvp.insert(make_pair(name, value)); // refactored 아시겠지만 위의 두 라인은 전혀 다른 기능을 하죠. C++03에 보면 각각 다음과 같이 설명되어 있습니다. 23.1.2/7 Associative containers a_uniq.insert(t): pair<iterator, bool> inserts t if and only if there is no element in the container with key equivalent to the key of t. The bool component of the returned pair indicates whether the insertion takes place and the iterator component of the pair points to the element with key equivalent to the key of t. 23.3.1.2/1 map element access [lib.map.access] T& operator[](const key_type& x); Returns: (*((insert(make_pair(x, T()))).first)).second. 원래 코드는 매번 새 값으로 이전 값을 overwrite했지만 새 코드는 이전에 키가 존재하면 새값으로 overwrite하지 않습니다. 따라서 원래 기능이 제대로 동작하지 않게 된것이죠. 그래서 물어봤죠. "왜 이렇게 했어?" "insert가 성능이 더 좋다 그래서 했지." :-? 사실 Fowler 아저씨는 Refactoring 책에서 refactoring은 성능을 optimizing하기 위한 것이 아니다라...