SqueakByExample:9.2
컬렉션의 다양성
컬렉션 클래스를 보다 잘 사용하기 위해, 사용자는 적어도 컬렉션 클래스들의 외형 및 컬렉션 클래스들의 공통점들과 차이점들에 대한 지식을 알고 있는것이 좋습니다.
각각의 구성요소들보다는, 컬렉션들을 사용하여 프로그래밍을 하는 것이 프로그램의 추상성의 수준을 끌어올릴 수 있는 보다 중요한 방법입니다. Lisp 언어의 map 함수는 함수와 목록을 인수로 받아서 목록의 각 요소에 각각 함수를 적용해서 결과를 목록으로 반환하며, Smalltalk-80 은 핵심원리로 (이런스타일을 따라) 컬렉션 기반 프로그래밍을 채택하였으며, ML 과 Haskell 과 같은 현대 함수기반 프로그래밍 언어들은 스몰토크의 스타일를 따랐다고 할 수 있습니다.
왜 이런것이 좋은 아이디어 일까요? 예를 들면 학생에 대한 레코드의 집합인 데이터 구조가 있고, 몇가지 기준에 부합하는 모든 학생의 레코드에 대해 같은 동작을 진행하기 원한다고 하죠. 기존의 언어를 사용하는 프로그래머라면 반복문을 바로 생각하겠지만, 스몰토크 프로그래머는 다음처럼 표현식 을 작성할 것입니다.
students select: [ :each | each gpa < threshold ]
위의 표현식은 대괄호 안의 함수가 true[1] 를 반환할때 students 의 element 를 포함하는 새 컬렉션으로 평가(evaluates)합니다. 스몰토크 코드는 도메인-특화 조회 언어의 단순성과 우아함을 갖고 있습니다.
그림 9.3: 표준 컬렉션 프로토콜
Protocol | Methods |
---|---|
accessing | size, capacity, at: anIndex , at: anIndex put: anElement |
testing | isEmpty, includes: anElement , contains: aBlock ,occurrencesOf: anElement |
adding | add: anElement , addAll: aCollection |
removing | remove: anElement , remove: anElement ifAbsent: aBlock ,removeAll: aCollection |
enumerating | do: aBlock , collect: aBlock , select: aBlock , reject: aBlock ,detect: aBlock , detect: aBlock ifNone: aNoneBlock ,inject: aValue into: aBinaryBlock |
converting | asBag, asSet, asOrderedCollection, asSortedCollection,asArray, asSortedCollection: aBlock |
creation | with: anElement , with:with:, with:with:with:,with:with:with:with:, withAll: aCollection |
메시지 select: 는 스몰토크의 모든 컬렉션에 전달될 수 있습니다. students 의 데이터 구조가 배열 또는 linked list 인지를 확인할 필요는 없습니다: select: 메시지는 양쪽 모두에 전달될 수 있습니다. 반복(loop)를 사용하는경우에는 students 가 배열인지 linked list 인지를 미리 알아두어야 합니다만, 반복과는 다르다는것에 주의해주시기 바랍니다. 스몰토크에서, 특정 컬렉션을 지칭하지않고 그냥 컬렉션 이라고만 하는 경우는, element 가 대상이 되는 객체에 들어있는지를 테스트하고 열거하기위한 잘 정의된 프로토콜을 지원하는 객체를 의미합니다[2]. 모든 스몰토크의 컬렉션은 isEmpty 와 occurrencesOf: 을 포함한 테스팅 메시지를 사용할 수 있습니다. 또한 모든 컬렉션은 열거 메시지 do:,select:, reject: (select: 의 반대되는 것), collect:(Lisp 의 map 과 같은), detect:ifNone:, inject:into: (왼쪽 fold를 수행하는)과 더 많은 메시지를 사용할 수 있습니다. 이런 프로토콜의 범용성과 다양성은 컬렉션을 강력하게 만들어주는 특징입니다.
그림 9.3을 통해 컬렉션 계층의 대다수 클래스들이 지원하는 표준 프로토콜을 정리했습니다. 이 메서드들은 Collection 을 상속받은 서브클래스 내에서 정의(define), 재 정의(redefine), 최적화(optimized) 도 가능하지만, 가끔 (서브클래스를 통한)사용이 금지되기도 합니다.
기본적인 일관성을 넘어선, 다양한 프로토콜들을 지원하거나 같은 요청에 다른동작을 제공하는 다수의 다른 컬렉션이 있습니다. 이제부터 중요한 몇가지 차이점들에 대해 알아보도록 하겠습니다:
- 순차가능(Sequenceable): 첫 번째 구성요소에서 시작하여 마지막 구성요소에 이르기까지 잘 정의된 순서로 진행되는 SequenceableCollection의 모든 서브클래스들의 인스턴스들입니다. 다른 한편으로는, Set, Bag 그리고 딕셔너리의 인스턴스들은 순차적으로 배치할 수 없습니다.
- 분류가능(Sortable): SortedCollection은 분류 수서에 따라 자체의 구성요소들을 유지합니다.
- 색인가능(Indexable): 가장 순차가능 컬렉션들은 또한 at:과 함께 검색할 수 있는 구성요소인 색인가능입니다. 배열은 고정된 크기를 가진 친숙한 indexable 데이터 구조이며 anArray at: n은 anArray의 nth 구성요소를 검색하며, anArray at: n put: v은 v에 nth 구성요소를 부과합니다. LinkedLists 와 SkipLists 은 sequenceable 이지만, indexable이 아닙니다. 그 의미는 이것들은 first와 last를 이해하지만 at:은 이해하지 못합니다.
- Keyed: 딕셔너리의 인스턴스들이며, 이것의 서브클래스들은 indices 대신에 keys로 접근할 수 있습니다.
- 수정가능(Mutable): Mutable: 대부분의 컬렉션들은 수정 가능하지만, 인터벌과 심볼은 그렇지 않습니다. 인터벌(Interval)은 정수의 범위를 나타내는 수정 불가능 컬렉션입니다. 예를 들면 5 to: 16 by: 2 는 구성요소 5, 7, 9, 11, 13과 15를 포함하고 있는 인터벌입니다. 이것은 at:과 함께 indexable 이지만, at:put:으로 변경될 수 없습니다.
- 성장가능(Growable): 인터벌의 인스턴스들과 배열은 항상 고정된 크기를 가집니다. 다른 컬렉션 종류는 (분류된 컬렉션, 순서가 정렬된 컬렉선 그리고 링크된 목록들)은 만들어진 이후에 성장할 수 있습니다. 클래스 OrderedCollection은 배열보다 좀더 일반적인 것이며, OrderedCollection의 크기는 성장할 것이고, 또한 그것은 at:과 at:put: 뿐만 아니라 addFirst:와 addLast:를 위한 메소드를 갖고 있습니다.
- 복제물 수락(Accepts duplicates): Set은 복제물을 걸러내겠지만, Bag은 그렇지 않을 것입니다. Dictionary, Set 그리고 Bag은 구성요소들에 의해 제공된 = 메소드를 사용하며, 이 클래스들의 Identity 변수들은 인수들이 동일한 오브젝트인지를 테스트하는 == 메소드를 사용하고 Puggable 변수들은 컬렉션의 생성자에 의해 공급된 임시 등가 관계를 사용합니다.
- 혼합(Heterogeneous): 대부분의 컬렉션들은 모든 구성요소들의 종류를 보유할 것입니다. 그럼에도 불구하고, String, CharacterArray 또는 심볼은 오직 문자만을 보유하고 있습니다. 배열은 모든 오브젝트의 혼합을 보유할 것이만, ByteArray는 오직 Bytes만을 보유하며, IntergerArray는 오직 정수들을 보유하며, FloatArray는 오직 Floats를 보유합니다. LinkedList는 프로토콜에 Link ▷ accessing protocol에 맞는 구성요소들을 보유하기 위해 제약됩니다.