여행하는 개발자 – 페이지 5

9월162013 by nobaksanNo Comments

TDD 초기

미분류

1. 작은 테스트를 하나 추가한다. 2. 모든 테스트를 실행해서 테스트가 실패하는것을 확인한다. 3. 조금수정한다. 4. 모든테스트를 실행해서 테스트가 성공하는 것을 확인한다. 5. 중복을 제거하기 위해 리팩토링을 한다. 소스는 https://starstory.googlecode.com/svn/ 에서 확인할수 있다. SVN으로 다운받아서 확인하기 바란다.

9월162013 by nobaksanNo Comments

TDD(테스트 주도 개발 고품질 쾌속 개발을 위한 TDD실천법과 도구)

미분류

책 소개 효율적인 설계와 간결한 코드를 만드는 필수 TDD 기법 『TDD 실천법과 도구』는 업고픔질 소프트웨어를 만드는 유쾌한 개발 비법 TDD를 다룬 책이다. 초급 개발자도 쉽게 학습할 수 있는 기본적인 테스트 주도 개발 방법은 물론 고급 개발자로 나아가기 위한 효과적인 설계 방법까지 다룬다. 또한 보기 좋고 간결한 코드를 만드는 유용한 개발 기법을 실용적인 예제를 통해 체계적으로 설명한다. TDD를 하면서 사용하는 도구를 예를 들어가며 단계별로 방법을 안내하고, 최신 도구를 많이 다루어 최신 정보를 한꺼번에 볼 수 있다. 오늘부터 공부한 내용을 업로드 하려 한다. 그 첫번째가 테스트 주도개발 TDD 에 관련된 내용이다. 중요한 내용만 발췌한 것이기 때문에 내용이 그렇게 자세하지는 않다. ...

9월102013 by nobaksanNo Comments

[장하나 의원] 농협, KT ‘막장프로젝트’ 사례를 제보해주세요.

미분류

[장하나 의원] 농협, KT ‘막장프로젝트’ 사례를 제보해주세요. 안녕하세요. 민주당 장하나 의원실 박기일 비서관 입니다. 아시는 분들도 계시겠지만, 저희 의원실에서는 지난 5, 6월에 ‘IT 개발자 실태조사’를 하고 국회에서 증언대회를 하여 여러 언론을 통해 개발자들의 실상을 알린바 있습니다. 7월에는 민주당 국회의원 다섯 분이 ‘막장’ 농협정보시스템에 항의방문도 다녀왔습니다. 저희 의원실은 개발자들의 환경을 개선하기 위해 두 가지 측면에서 접근을 하고 있습니다. 하나는 다단계하도급 문제를 근절하기 위한 「소프트웨어산업진흥법」의 개정입니다. 다른 하나는 고용노동부가 IT업계의 근로기준법 준수여부를 제대로 관리감독 하도록 만드는 것입니다. 고용노동부는 IT업계의 특성상 근로감독이 쉽지 않다는 말로 자신들의 의무를 방치하고 있습니다. 농협정보시스템에 대해서는 ‘폐 잘라낸 개발자’ 양 모씨의 사례가 올해 다시 이슈가 되니까 고용노동부가 근로감독을 하기는 했는데 결과가 무척 실망스러운 수준이었습니다. 400명 가까이 되는 전체직원 중에서 단 10명이 연장근로한도를 2시간 정도 초과했다는 것입니다. 현행 근로기준법은 일주일에 40시간 근로에 연장근로는 12시간까지만 허용하고 있습니다. 요약하면 고용노동부가 농협정보시스템을 근로감독해서 400명 중 10명이 일주일에 54시간을 일했다는 것을 적발한 것입니다. 그리고는 충분히 제대로 조사했다는 말만 되풀이하고 있습니다. 그래서 저희 의원실에서 IT업계 ‘막장프로젝트’의...

9월102013 by nobaksanNo Comments

2013년 하반기 자바카페 스터디 회원모집 안내

미분류

URL: http://onoffmix.com/event/19039 안녕하십니까? 자바카페(www.javacafe.or.kr)입니다. 다음과 같이 2013년 하반기 자바카페 스터디 회원을 모집합니다. 이번 스터디는 공개소프트협회와 정보통신산업진흥원(NIPA) 후원으로 스터디 장소가 무료로 지원됩니다. 스터디 전문 공간인 토즈(http://www.toz.co.kr) 전지점을 무료로 이용하실 수 있습니다. 많은 참여 부탁 드립니다. 오리엔테이션 장소: 상암 누리꿈스퀘어 대강의실 오리엔테이션 날짜: 2013년 9월 28일(토) 오후 2시 1. 모집분야 ★★★ 난이도 중 스터디 ★★★ 1-1. SQLP(DB자격검정) 시험 대비팀 SQLP는 한국데이터베이스진흥원(http://www.kdb.or.kr/busi/busi_05_sqlp.php) 에서 주관하는 데이터베이스 관련 공인 자격제도입니다. SQLP 시험을 위한 스터디 팀입니다. 1-2. 안드로이드 커널 & 라즈베리파이 실제 커널 소스 및 자료를 가지고 장비에 포팅하고 프레임워크 내부에 구조 및 동작 원리를 연구하는 스터디 팀입니다. (라즈베리파이 or 안드로이드 장비 개인별 구매 필요) 1-3 Hadoop Hadoop 및 기반 인프라 기술들을 학습합니다. (Hadoop 경험 필요) ...

9월22013 by nobaksanNo Comments

#016 집단지성과 관련있는 콘텐츠 종류

SEARCH ENGINE

1. 블로그 - 다른말로 웹로그는 다른사람들과 공유하고 싶은 내용에 대해서 글을 쓰는 개인적인 온라인 저널이다. 다른 사용자들은 블로그에 댓글을 달수 있다. 블로그는 일반적으로 다이어리 형식으로 작성되며, 다른 웹 사이트를 가리키는 링크도 포함된다. 블로그의 활용: 1. 회사 웹사이트 0 회사들은 주주나 고객, 직원 다른사람들과의 연결점으로 블로그를 활용한다. 때로는 중요한 결정이나 정책에 대한 피드백을 받는데 사용하기도 한다. 또한 블로그는 어떤 결정이나 정책의 근거를 전달하는 적적한 포럼역할도 할수 있다. 또한 개발중인 제품의 피드백을 얻는데 활용할수도 있다. 2. 애플리케이션 내부- 애플리케이션에서 내외부적으로 관련성있는 정보를 제공하는데 블로그를 사용할수 있다. 애플리케이션 내부에서 사용자들이 블로깅을 하게 함으로써 다른 사람들에게 보여질수 있는 추가 콘텐츠를 만들어 낼수 있다. 3. 블로고스피어에 있느 다른 블로그 - 블로고 스피어에 있는 다른 블로그들은 여느 글은 제품에 대한 대중의 관심도를 높일수 있고, 반면에 부정적인 언급은 제품에 저주를 내릴수 있다. ...

9월22013 by nobaksanNo Comments

#015 북마킹, 리뷰 등 메타데이터를 사용한 지능 정보화

SEARCH ENGINE

1. 콘텐츠 접근 방법: 텀 백터는 키워드나 태그와 관련된 가중치 값을 가지고 있다. 콘텐츠를 저장하고, 콘텐츠에 접근하거나 콘텐츠를 추천하는 사용자는 관련 아이템의 메타데이터에 영향을 받는다. 2. 협업기반 접근 방법: 북마킹된 데이터 수집하고 분석하기, 아이템 저장하기, 다른 사용자를 위한 아이템 추천하기등 수집된 데이터를 분석하는 방법은 서로 비슷하다.

9월22013 by nobaksanNo Comments

#014 예제를 통해 본 등급의 지능 정보화

SEARCH ENGINE

간단하게 아이템에 대한 등급 정보를 합한후 평균값을 제강하는 방법 - 가장 인기있는 등급이 높은 상위 열개의 아이템을 뽑을때 유용할 것이다. 클러스터링- 비슷한 사용자들을 묶어줄수있는 기법 : 특정 사용자와 비슷한 사용자들의 그룹에서 계산되어 나온 아이템의 평균 등급은 이전에 설명한 일반적인 평균 등급에 비해 더 적절하다. 사진1 사진2 사진3 평균 제인 3 4 2 3 도 2 2 4 8/3 존 1 3 5 3 평균 2 3 11/3 26/3 위의 예제 데이터를 기반으로 아래와 같은 질문에 답을 해 보자 1. 특정 아이템과 유사한 아이템은 무엇인가? 2. 한 사용자와 유사한 다른 사용자는 누구인가? 이에 대한 답변은 코사인 기반 유사도와 상관계 기반 유사도, 적응 코사인기반 유사도 기법을 사용해 도출할수 있다. 1. 코사인 기반의 유사도 관계 : 두 벡터의 내적 : 행이 사진, 열이 사용자에 상응되게끔 행렬을 전치 한다. 열의 각 항목이 의미하는 바는 사진을 설명하는 차원이라 생각하면된다. :첫번째 행에서는 ROOT(3^2+2^2+1^2) = root14 = 3.1744 존 제인 도 사진1 0.8018 0.5345 0.2673 사진2 0.7428 0.3714 0.557 사진3 0.2981 0.5963 0.7454 이 결과를 기반으로 벡터의 내적을 계산하면 두아이템간의 유사도를 알수 있다. 사진...

9월22013 by nobaksanNo Comments

#013 웹2.0이란.

SEARCH ENGINE

웹 2.0이란 결국 비슷한 사람들을 서로 연결해주는 방법에 대한 것이다. 유사성은 취향, 직위, 의견 또는 지리적 위치등이 될수 있다. 취향과 의견은 리뷰와 추천에서 자주 나타난다. 이런 것들은 다음과 같은 상황에서 다른 사용자에게 매우 큰 영향을 준다. 1. 편견이 없는 의견 2. 유사한 사용자의 리뷰 3. 영향력이 큰 사람의 취향이나 의견

9월22013 by nobaksanNo Comments

#012 유사도 계산(데이터 유형)

SEARCH ENGINE

1. 템벡터는 방향과 크기가 있는 벡터다 알고리즘은 분석 작업을 하기 위해 데이터를 입력 받는다. 여러 인스턴스로 구성된 데이터는 테이블 형태로도 표현할수 있다. 이런 테이블에서 데이터가 어떻게 분포되어 있느냐에 따라, 고밀도 데이터셋과 고차원 저밀도 데이터 셋으로 구분된다. 2. 데이터 유형 예) 사이트에 세사람이 머무는 시간 나이 성별 하루동안 사이트에 머무는 시간 존 25 M 25 조 30 M 20 제인 20 F 30 데이터셋에서 사이트에서 보낸시간을 예측 할수 있는 중요 인자는 나이, 사이트에서 보낸시간이다. 그러나 성별 속성은 예측에 필요없는 데이터 이다. 1. 고밀도 데이터셋 - 사용자가 늘어날수록 데이터셋의 행은 늘어난다. - 행의 개수가 열의 개수보다 더 많다. - 고밀도 데이터 셋은 각 셀마다 값이 존재한다. ------------------------------------------------------------- 고차원 저밀도 데이터셋은 일반적인 형태의 텀 백터이다. 이 데이터 셋을 이해하기 위해서는 지난주라는 시간 영역을 생각하여야 한다. 같은 시간 영역에서 비디오를 본 사용자 집단과 아닌경우로 나눌수 있다. 동영상1 동영상2 동영상3... 존 1 조 1 1 제인 ...

9월22013 by nobaksanNo Comments

#011 비구조적 텍스트에서 지능형 정보 추출

SEARCH ENGINE

벡터스페이스 모델 벡터공간 모델 상에서 각 도큐먼트들과 질문자들은 n차원 공간 속의 벡터들로 취급되며, 이때 각 차원들은 색인용어들로 표현된다. 이 기법에 의한 검색 절차는 다음과 같다. 1) 용어의 가중치는 정규화된 도큐먼트내의 빈도(TF)와 이의 역빈도수(IDF)를 조합하여 게산 2) "낮은 식별치(poor discrimination value)의 값을 지닌 용어들은 시소러스내의 저 빈도용어들로 대치되며 구의 경우 고빈도 용어들로 대체된다. 3) 각 도큐먼트들은 이용자 질문에 대해서 그 유사성의 순위별로 출력되며, 이러한 과정은 코사인 상관도에 의해 계산된다. (벡터 공간 내에서 이용자의 질의에 가장 근접해 있는 도큐먼트들을 직관적으로 검색해낸다.) 자세한 내용은 다운받아 보시길... 1. Definition 2. Applications 3. Examples 4. Limitations 5. Reference 6. Models based on and extending the vector space model COF-Vector Space Model.pdf 벡터 스페이스 모델은 문서를 표현하는데 가장 많이 사용되는 방법 텍스트-텀가중치-텀가중치-텀가중치 의 형태로 문서를 표현하는데, 이는 문서에 등장하는 텀과 각 텀의 관련 가중치로 구성된다. 텀백터는 아이템과 관련된 메타데이터를 표현하는 하나의 표현형태이다. 텀가중치는 텀의 빈도와 역문서빈도(TFIDF)를 조합하여 결정된다. 텀 빈도는 한 문서안에서 텀의 출연한 빈도이다. 특정 문서내에서 자주...