학창시절 Swing을 정말 열심히 공부했던 기억이 난다.. 그러고 보니 그때가 이미 10년전인가..

Swing은 MVC기반의 Java의 UI Framework으로 기존의 AWT 제약을 탈피하고, 탄생한 Java GUI를 위한 회생의 역작이라고도 할 수 있다..

물론 그 이면에는 MS의 아성을 띄어넘기 위해 PC Client 시장을 장악하기 위한 Sun의 초대회장 Scott Mcnealy의 야심의 결과물인지도 모르겠다..

어찌되었건,

학창시절 정말 열심히 Swing을 공부했다.. Swing은 철저희 MVC의 기본 원칙을 내세우며 완벽에 가까운 객체지향 기반의 API를 제공한다. Swing 한번 정도 해본 사람들이라면 JTable의 악몽을 기억할 것이다. 엑셀같은 간단한 Sheet를 표현하기 위해서 얼마나 많은 Interface와 Class간 의존구조를 알아야 하는지..

그리고 사실상 디자인 패턴이나 중고급이상의 S/W 설계 지식이 없으면 제대로 사용할 수 도 없는, 지금 생각해보면 극악의 어려움을 제공하는 구조임에는 틀림없었으나,

Swing의 사용 경험을 통해 객체지향 설계의 많은 부분을 경험할 수 있었고, 이후에 많은 프로그래밍 설계에 있어서 경험적 지식의 기반이 되었다는 점에서 공부한것에 대해 그리 나쁘지 않았다고 생각된다..


이후, Swing은 거의 사장되고, 아무도 쓰지 않는 상황이 되버렸지만,

어찌보면 Swing을 공부했던 사람들에게 Android는 정말 하늘에서 내려준 선물이 아닐까 생각이 들 정도로, 구조적인 측면 사용성의 측면에서 Swing의 것을 닮아있다..

물론 결국 둘다 GUI 프로그래밍을 위한 것이다 보니 설계의 구조적으로 비슷해 질 수 밖에는 없겠지만..


Android는 Swing 혹은 AWT에서 사용하던 LayoutManager들과 거의 유사한 기능을 제공하며, Swing 코드 작성시 많이 생성되는 반복적이고 Tree 구조의 특성을 xml로 분리하여, 개발 효율을 극대화 시켰다고 봐도 무방할 것 같다.

EventListener를 이용한 이벤트 Handling 방식은 Swing이나 AWT에서 사용했던 방식과 거의 동일하며, 모듈의 Life Cycle 관리나 Paint 메카니즘은등은 Applet의 그것과 매우 유사하다. (이건 뭐 다른 유사 시스템에서 비슷할 것으로 보인다)


Android Platform 초기에는 OSGi 가 탑재될뻔 했던적이 있었던 것으로 생각난다. OSGi 가 탑재되면 개발측면에서 많은 부분 Application 간의 의존성 관리나 App - Service 사용 측면에서 유리한 점이 많아 질 것 같지만, 현 분위기상 쉽지는 않아 보인다.

하둡 MapReduce 개발시, 개발환경을 어떻게 설정해야하는 것이 최선인지는 아직도 고민중입니다.

jar로 배포되어 Hadoop에 의해 로드되어 구동되는 구조적 특성상, 이클립스에 개발환경을 설정해서 뭔가를 해본다는 것이 상당한 제약이 많은 것이 사실이며, 이러한 이유 때문인지는 몰라도 아직 쓸만한 Eclipse Plugin하나 없는 실정입니다. 

Hadoop 정식 배포버전의 contrib 폴더에는 누군가에 의해 개발된 hadoop plugin이 있는데, 어떻게 설치라도 해볼려고 하니 쉽지가 않네요, ant 빌드를 해야하는데 한번에 될리가 없고, 설정상 수정이나 추가가 필요한 부분이 있습니다.

그래서 대략 일주일 삽질끝에 정상 동작하는 이클립스 플러그인으로 빌드하는데 성공하였습니다.

아래의 파일은 이클립스 Indigo(3.7), Hadoop 1.1.0 기준으로 빌드되어 정상동작이 확인되었습니다.


hadoop-eclipse-plugin-1.1.0.jar



타버전의 빌드가 필요하신 분들은 아래 링크를 참고하세요. 

(library 버전이 상위버전인 경우 정상동작 하지 않습니다.)

http://cloudfront.blogspot.kr/2012/07/how-to-run-mapreduce-programs-using.html

http://creatorw.tistory.com/entry/%EC%9D%B4%ED%81%B4%EB%A6%BD%EC%8A%A4%EC%97%90-%ED%95%98%EB%91%A1-%ED%94%8C%EB%9F%AC%EA%B7%B8%EC%9D%B8-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0




'Expired > Hadoop Hbase Nutch2' 카테고리의 다른 글

Hbase를 활용한 로그 모니터링 시스템 개발  (0) 2017.04.15
Hbase JSON API 사용하기  (0) 2015.01.04
Nutch Cycle Step  (0) 2015.01.03
결론부터 말하면 NonBlocking의 원리, Network 프로그래밍일 경우 OS에서 동작하는 Socket의 동작 방식을 모르기 때문이다.

Java의 Standard IO의 경우 사실 단순하다.
하나의 Connection에 대해서 하나의 Thread가 1:1로 대응되어,
개발시 하나의 Connection에 대한 처리 로직이 명확하고, 다른 Connection에 대해 독립적이기 때문이다.

쉽게 말해 개발자가 개발하기 쉬운 구조다.

하지만 NIO의 경우 다수의 Client Connection을 극단적인 경우 하나의 Thread 만으로도 처리할 수 있는 구조이다.

NonBlocking에 대한 심도 깊은 이해가 필요하다.
사실 NonBlocking은 의미적으로는 간단하다.
NonBlocking Method를 호출할때 일반 IO와 달리 Blocking 되지 않고 즉시 Return됨을 의미한다.

하지만 Blocking IO만 접해왔던 개발자들에게 즉시 Return이라는 것은 쉽게 이해할 수 없는 부분이다.

왜냐하면 read(buffer) 라는 method를 call해서 int형으로 넘겨받은 값이, 실질적으로 client에 전송된 byte의 수를 의미하는 것인데, 이것은 달리 해석하면, data 전송이후 실질적으로 client가 해당 data를 consume한 것이 확인 되었을때 알 수 있는 값이기 때문이다.

쉽게 말해서 blocking method 호출시 최소한 작업 완료에 대한 응답값이 필요하다.
서버가 특정 data를 전송했을때, client로 부터 data가 consume되었다는 프로토콜 구조적인 확인이 필요하고, 이때 client의 처리가 지연될 경우 method 호출로 인해 blocking 되는 시간은 길어진다고 볼 수 있다.

다시 본론으로 돌아와서,
그렇다면 NIO 의 write(buffer) 를 호출했을때 어떠한 원리로 blocking 없이 즉시 return 값을 받을수 있을까?

이것을 이해하기 위해서는 OS의 Socket에 대한 이해가 필요하다.
더 자세히 말해 Socket Buffer에 대한 이해가 절대적으로 필요하다. 

결론부터 얘기하면,
Kernel Level의 모든 Socket Object는 자체적인 Read/Write Buffer를 가진다.
Socket Buffer로 넘겨진 data는 실질적으로 OS의 Kernel로 그 제어권이 넘어간 것이라 할 수 있다.
Application Level에서 Socket Buffer의 Data가 넘어가는 순간 실질적인 Data 전송의 스케쥴링은 Socket을 컨트롤 하는 OS에 달렸다고 볼수 있다. (물론 Application Level에서 Socket Buffer의 크기를 조절하여, 간접적인 Data 전송 스케쥴도 가능하긴 하다)
NIO의 핵심 메카니즘은 Socket Buffer에 단순히 Data를 Write하고 Read하는 역할 밖에는 하지 않는다.

단순히 메모리상의 특정 영역(Java Memory Area)에서 OS의 영역(Socket Buffer in Kernel)으로 데이터를 Write/Read하는 작업만을 하기때문에, 실질적으로 Blocking이 없다고 볼 수 있다.

예측할 수 없는 Data가 불규칙적으로 오고가는, Socket Buffer의 Data를 효과적으로 감시하기 위해서는, Polling이 아닌 Event기반의 감시자(Monitor Object)가 필요한데, 그 역할을 하는 것이 NIO의 Selector Object이다.

Selector에 대한 자세한 설명은 다음 강좌에 연재하겠다.

어찌되었건, NIO의 핵심은 구현 관점에서 NonBlocking Call과 Event기반의 처리라 볼 수 있다.
특징은 기존 IO에 비해 구현은 훨씬 복잡해지면서 Thread의 수를 최소화 할 수 있어서 대량접속에 대한 처리에 대해 쓰레드의 Context Switching 비용의 부담에서 벗어 날 수 있다.

물론 구현이 복잡해 지는 만큼, Design(설계)시 고려사항이 많아지며, 필수적이고 잘 알려진, Network, Thread,  I/IO 관련 Design Pattern에 대한 이해가 필수적이다.

-글 : 김영곤(gonni21c@gmail.com)
다음편에 계속..
SUBTYPES MUST BE SUBSTITUTABLE FOR THEIR BASE TYPES.

하위타입의 객체가 상위 객체를 대체할 수 있어야 한다.

Have you ever seen code that has lots of instanceof expressions in the clauses of if
statements. Though there are some legitimate uses for expressions like this, they are few
and far between. Usually they are a result of violating the LSP, and are themselves a violation
of the OCP.

The LSP says that the users of base classes should not have to do anything special in
order to use derivatives. Specifically, they should not have to use instanceof, or downcasts.
Indeed, they should know nothing about the derivatives at all. Not even that they
exist.

Consider the payroll application shown in Figure 6-8. The Employee class is abstract
and has an abstract method named calcPay. It’s pretty clear that SalariedEmployee
will implement this to return the employee’s salary. It’s also pretty clear that Hourly-
Employee will implement it to return the hourly rate times the sum of the hours on this
week’s time cards.
SOFTWARE ENTITIES (CLASSES, MODULES, FUNCTIONS, ETC.)
SHOULD BE OPEN FOR EXTENSION, BUT CLOSED FOR MODIFICATION.

S/W의 요소(클래스, 모듈, function)은 확장에는 열려있고, 
수정에는 닫혀있어야 한다.

This principle has a high-falutin’ definition, but a simple meaning: You should be able to
change the environment surrounding a module without changing the module itself.

이 원리의 핵심은 어떤 특정 기능을 시스템 자체의 모듈을 변화시키지 않고도, 
기능상의 변화를 줄 수 있다는 것이다.

Consider, for example, Figure 6-4. It shows a simple application that deals with
Employee objects through a database facade named EmployeeDB. The facade deals
directly with API of the database. This violates the OCP because a change to the implementation
of the EmployeeDB class can force a rebuild of the Employee class.
The Employee is transitively bound to the database API. Any system that contains the
Employee class must also contain TheDatabase API.

EmployeeDB는 DAO 역할을 하는 class이며, DB의 API를 직접적으로 Access하는데,
이것은 OCP 위반에 해당된다. 왜냐하면 EmployeeDB의 변경이 client, 즉 Employee의 
변화까지 동반하기 때문이다.

결국 coupling으로 인해 기능상 확장성이 떨어지는 구조라 하겠다.


Unit tests are often the places where we want to make controlled changes to the environment.
Consider, for example, how we would test Employee. Employee objects make
changes to the database. In a test environment we don’t want the real database to change.
We also don’t want to create dummy databases just for the purposes of unit testing.
Instead, we’d like to change the environment so that the test catches all the calls that
Employee makes to the database, and verifies that those calls are made correctly.

Employee를 Unit 테스트할 경우 Real DB에 영향을 주는 것은 문제가 될 수 있으며,
Test를 위한 Dummy Object를 생성하는 것도 코드의 수정을 동반하기 때문에 좋지 못하다.
결국 Employee의 호출을 검증할 수 있는 테스트 환경의 제공이 최적의 조건이라 할 수 있다.


We can do this by converting EmployeeDB to an interface as in Figure 6-5. Then we
can create derivatives that either invoke the true database API, or that support our tests.
The interface separates Employee from the database API, and allows us the change the
database environment that surrounds Employee without affecting Employee at all.

이러한 문제는 DAO 자체를 Interface로 변경해서 해결할 수 있다.
테스트용 DB 환경과 Real DB 환경을 유연하게 사용할 수 있다.
Empoyee에 어떠한 영향을 주지 않고 자유롭게 DB 환경을 제어할 수 있다는것 이점.




A CLASS SHOULD HAVE ONLY ONE REASON TO CHANGE.
하나의 클래스는 변화에 오직 하나의 이유만 있어야 한다.

You’ve probably read the nonsense about objects needing to know how to draw themselves
in a GUI, or save themselves to disk, or convert themselves to XML, right? Beginning
OO texts like to say things like that. Ridiculous! Classes should know about only one
thing. They should have a single responsibility. More to the point, there should only be
one reason for a class to change.

 Consider Figure 6-1. This class knows way too much. It knows how to calculate pay
and taxes, how to read and write itself on disk, how to convert itself to XML and back, and
how to print itself on various reports. Can you smell the Fragility? Change from SAX to
JDOM and you have to change Employee. Change from Access to Oracle, and you have t
change Employee. Change the format of the tax report and you have to change
Employee. This design is badly coupled.


하나의 클래스가 너무나 많은 역할(responsibility)를 가지고 있어 coupling이 극도로 증가한 상태


In reality we want to separate all these concepts into their own classes so that each
class has one, and only one, reason to change. We’d like the Employee class to deal with
pay and taxes, an XML related class to deal with converting Employee instances to and
from XML, an EmployeeDatabase class to deal with reading and writing Employee
instances to and from the database, and individual classes for each of the various reports.
In short, we want a separation of concerns. A potential structure is shown in Figure 6-2

위의 복잡한 것을 각자의 역할을 가지는, 변화에 대해 단 한가지 이유를 가지는 개별의 class로 나누어야 한다.



Violation of this principle is pretty easy to spot in a UML diagram. Look for classes
that have dependencies on more than one topic area. A dead give-away is a class that
implements one or more interfaces that endow it with certain properties. Careless use of an
interface that endows an object with the ability to be stored on disk, for example, can lead
to classes that couple business rules with issues of persistence.

잘못된 interface의 상속구조의 사용한 향후 coupling의 문제를 야기시킨다.


Consider the two diagrams in Figure 6-3. The one on the left couples Persistable
tighly into Employee. All users of Employee will transitively depend upon
Persistable. This dependence may not be great, but it will be there. Changes to the
Persistable interface will have the potential of affecting all users of Employee.

좌측의 구조는 Employee와 Persistable interface가 강하게 coupling된 상태로,
Persistable의 변화가 모든 Employee 클래스에 영향을 줄 수 있다.


The diagram on the right side of Figure 6-3 leaves Employee independen of Persistable,
and yet allows for persistence just the same. Instances of PersistableEmployee
can be passed around the system as Employees, without the rest of the
system knowing about the coupling. The coupling exists, but is hidden to most of the system.

우측의 구조는 Employee가 Persistable에 독립된 구조로,
시스템 상에서 coupling이 없는 상태로 Employee의 형태로만 사용될 수 있다.
coupling은 존재하지만, hidden으로서의 이점이 있다.


+ Recent posts