산포도

마지막 업데이트: 2022년 2월 3일 | 0개 댓글
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기

산포도의 반댓말은? 염기포도 죽은포도 바다포도 강포도 산포도를 영어로 하면? Mountain Grape 안나올 리가 없지 반에서 한 명은 기어코 이 개드립을 포기하질 않는다

Degree of scattering
散布度

3 사분편차

4 평균편차

5 분산과 표준편차

분산은 쉽게 말하면 편차의 제곱의 평균이고, 표준편차(stdev; standard deviation) [3] 는 짧게 말해서 분산에 루트를 씌운 것이다. 분산에서 왜 제곱을 하는지 알고 있다면, 표준편차에서 왜 루트를 씌우는지도 알 수 있다. 분산을 구하는 과정에서 마이너스 기호를 떨구기 위해 임의로 뻥튀기를 해 놓았으니, 이제 그 값을 도로 원상복구(…)시켜야 하는 것이다. 즉 제곱해서 커져 버린 값에 루트를 씌워서 도로 쪼그라들게 만들면 비로소 우리가 본래 알고 싶어하던 편차의 평균이 얻어지게 되는 것이다. 통계학자들은 쓸데없이 어려워 보이도록 시그마 소문자 기호로 표준편차를 표시하는데, 위에 서술한 바에 의해서 분산의 경우는 시그마 제곱으로 표현된다.

편차제곱을 먼저 합치고 루트씌운 것을 루트 자료개수로 나눈 것과, 편차제곱 각각을 루트씌운 다음에 합쳐서 자료개수로 나눈 것이 과연 같은지는 의문이다. 편차제곱 각각을 루트를 씌우면 그냥 편차가 되고 편차의 합은 0이니까 평균도 0이잖아 직접 해보면 될거아냐

표준편차의 경우, 모든 관찰값에 동일한 상수를 똑같이 더하거나 빼는 것은 영향을 받지 않지만, 똑같이 곱하거나 나누게 되면 표준편차도 동일하게 영향을 받는다. 모든 수에 2를 곱한다면 표준편차도 2가 곱해진 새로운 값으로 구해지게 된다.

Institute for Healthcare Improvement(IHI)는 병원의 질향상을 돕기위해 기본적 도구세트를 개발하여 제공하고 있다.

이 도구세트에는 Documentation tools, General tools, Information gathering 산포도 tools, Meeting tools, Process analysis tools등이 포함되어있다 앞으로 IHI에서 제공하는 tool을 차례로 소개하고자 한다

산포도는 두 변수사이의 관계를 그림으로 보여줌으로써 원인-결과 관계를 확인하고 이해할 수 있도록 한다.

  1. 자료를 산포도 수집한다; 각 변수에 대한 최고, 최저값을 결정한다.
  2. 각 축에 어떤 변수를 점으로 나타낼 것인지 결정한다.

- 원인-결과간의 관계를 설정하고, 의심되는 원인을 x축에 놓고 의심되는 결과를 Y축에 놓는다.

- 같은 길이로 축을 만들고 사각의 plotting area(점을 찍는 범위)를 만든다.

- 각 축에는 왼쪽에서 오른쪽으로, 아래에서 위쪽으로 값이 커지도록 한다.

- 각 축에는 해당 변수에 대한 전체 범위를 보여준다.

- paired-data를 점을 사용하여 나타낸다.

- 채워진 점, 채워지지 않은 점, 색을 달리하여 사용함으로써 각각의 자료를 보여준다.

보상수준과 사망률 관계 산포도 예시

이 산포도는 병원내 사망의 산포도 위험(Y축)과 보상수준(X축) 사이의 관계를 보여준다. 산포도를 만드는데 사용된 standardization elements(표준화 요인)들은 다음과 같다

- 사망에 80% 이상 책임이 있는 진단명을 사용한다.

- 환자 특이적 위험 요인와 관련이 있는 변수를 개발한다. 예를 들면, 진단명들, 연령, 입원유형 등

- 국가평균 사망률과 산포도 병원의 표준화 사망률을 비교한다.
예를 들면, 국가평균과 같은 표준화 사망률을 가진 병원은 100 HSMR(Hospital Standardized
Mortality Rate)을 가지고, HSMR이 100보다 큰 것은 예측사망률보다 사망률이 높다는 것을 의미한다.

genie 홈으로 가기

남상규 Best Golden Collection

1. 댓글 숨김
타인에 의하여 5회이상 신고가 접수 된 댓글의 경우, 해당 산포도 게시글 접근을 임시적으로 차단하는 조치를 할 수 있습니다. 숨김 처리된 댓글의 작성자가 복원 신청을 할 경우 심의 결과에 따라 삭제 또는 복원 될 수 있습니다.

2. 댓글 삭제
사용자들의 신고 또는 관리자에 의해 아래에 해당하는 내용이 포함 된 댓글이 발견 되었을시, 예고없이 삭제 조치를 하겠습니다.

(1) 타인의 명예를 손상시키거나 불이익을 주는 행위
(2) 음란물을 게재, 공개하거나 음란 사이트를 연결하는 행위
(3) 욕설, 비속어 사용 및 특정대상을 비하하는 행위
(4) 공공질서 및 미풍양속에 위반되는 내용의 정보, 문장, 도형 등을 타인에게 유포하는 행위
(5) 상업적 광고 또는 사이트/홈피를 홍보하는 행위
(6) 같은 내용의 글을 반복적으로 작성하는 행위
(7) 지역 감정 및 정치적으로 민감한 내용으로 회원들간의 분란을 야기하는 행위
(8) 기타 관련 법률 및 약관에 위배되는 글을 작성하는 행위

3. 이용 제한
관리자에 의하여 3회 이상 삭제 당하였거나, 지속적으로 악의적인 댓글을 작성한 사용자는 댓글 작성 기능에 제한을 받습니다. 제한 기간은, 작성한 글의 내용과 상습적인지 판단하여 결정합니다.

자연예서

[자연예서]껍질째먹는 청포도 8kg 고당도 수입산포도

(해외배송 가능상품)

기본 정보
상품명 [자연예서]껍질째먹는 청포도 8kg 고당도 수입산포도
원산지 칠레
배송비 2,500원 ~ 2,500원

구매조건에 따라 배송비 차등부과

  • 0원 이상 ~ 30,000원 미만 2,500원

상품 옵션
옵션선택

(최소주문수량 1개 이상 / 산포도 최대주문수량 0개 이하 )

위 옵션선택 박스를 선택하시면 아래에 상품이 추가됩니다.

할인가가 적용된 최종 결제예정금액은 주문 시 확인할 수 있습니다.

상품상세정보












상품결제정보

고액결제의 경우 안전을 위해 카드사에서 확인전화를 드릴 수도 있습니다. 확인과정에서 산포도 도난 카드의 사용이나 타인 명의의 주문등 정상적인 주문이 아니라고 판단될 경우 임의로 주문을 보류 또는 취소할 수 있습니다.

무통장 입금은 상품 구매 대금은 PC뱅킹, 인터넷뱅킹, 텔레뱅킹 혹은 산포도 가까운 은행에서 직접 입금하시면 됩니다.
주문시 입력한 입금자명과 실제입금자의 성명이 반드시 일치하여야 하며, 7일 산포도 이내로 입금을 하셔야 하며 입금되지 않은 주문은 자동취소 됩니다.

  • 배송 방법 : 택배
  • 배송 지역 : 전국지역
  • 배송 비용 : 2,500원 ~ 2,500원
  • 배송 기간 : 3일 ~ 7일
  • 배송 안내 : - 산간벽지나 도서지방은 별도의 추가금액을 지불하셔야 하는 경우가 있습니다.
    고객님께서 주문하신 상품은 입금 확인후 배송해 드립니다. 다만, 상품종류에 따라서 상품의 배송이 다소 지연될 수 있습니다.

교환 및 반품정보

교환 및 반품 주소
- [31738] 충청남도 당진시 송악읍 틀모시로 355-24 물류센터

교환 및 반품이 가능한 경우
- 계약내용에 관한 서면을 받은 날부터 7일. 단, 그 서면을 받은 때보다 재화등의 공급이 늦게 이루어진 경우에는 재화등을 공급받거나 재화등의 공급이 시작된 날부터 7일 이내
- 산포도 공급받으신 상품 및 용역의 내용이 표시.광고 내용과 다르거나 계약내용과 다르게 이행된 때에는 당해 재화 등을 공급받은 날 부터 3월이내, 그사실을 알게 된 날 또는 알 수 있었던 산포도 날부터 30일이내

교환 및 반품이 불가능한 경우
- 이용자에게 책임 있는 사유로 재화 등이 멸실 또는 훼손된 경우(다만, 재화 등의 내용을 확인하기 위하여 포장 등을 훼손한 경우에는 청약철회를 할 수 있습니다)
- 이용자의 사용 또는 일부 소비에 의하여 재화 등의 가치가 현저히 감소한 산포도 경우
- 시간의 경과에 의하여 재판매가 곤란할 정도로 재화등의 가치가 현저히 감소한 경우
- 복제가 가능한 재화등의 포장을 훼손한 경우
- 개별 주문 생산되는 재화 등 청약철회시 판매자에게 회복할 수 없는 피해가 예상되어 소비자의 사전 동의를 얻은 경우
- 디지털 콘텐츠의 제공이 개시된 경우, (다만, 가분적 용역 또는 가분적 디지털콘텐츠로 구성된 계약의 경우 제공이 개시되지 아니한 부분은 청약철회를 할 수 있습니다.)

※ 고객님의 마음이 바뀌어 교환, 반품을 하실 경우 상품반송 비용은 고객님께서 부담하셔야 합니다.
(색상 교환, 사이즈 교환 등 포함)

Matplotlib 산포도에 히스토그램 추가하기

산포도는 두 변수의 상관관계, 분포를 시각적으로 보여주는 그림인데요. 하지만 단순히 산포도 하나만으로는 개별 변수의 분포를 보기가 어려울 수 있는데요. 이때 개별 변수의 히스토그램을 추가한다면 두 변수의 상관관계와 분포뿐만 아니라 산포도 개별 변수의 분포도 볼 수 있을 것입니다.

따라서 이번 포스팅에서는 Matplotlib을 이용하여 산포도에 히스토그램을 추가하는 방법을 알아보도록하겠습니다. Matplolit을 이용하여 산포도, 히스토그램을 그리는 방법에 대해서 포스팅한 것이 있으니 잘 모르시는 분들은 보고 오시는 것을 추천드려요.

여기서 다루는 내용은 다음과 같습니다.

1. 산포도에 히스토그램 추가하기

산포도에 히스토그램을 추가하기 위해선 다음과 같이 세개의 axes를 만들어줘야 합니다. 여기서 axes는 x축과 y축으로 둘러싸인 공간이라고 생각하시면 됩니다. 이해를 돕기 위해 아래 그림을 살펴보겠습니다.

먼저 left 와 bottom은 axes1가 그려질 좌측 하단 꼭지점이라고 생각하시면 됩니다. 이 꼭지점으로 부터 폭 width, 높이 height 만큼의 공간을 갖는 axe1을 만들고 이 안에 산포도를 그릴 겁니다. 다음으로 bottom+height, left을 꼭지점으로 시작해서 폭 width, 높이 sub_height 만큼의 공간을 갖는 axes2를 만들고 여기에는 x 변수의 히스토그램을 그릴 겁니다. axe3도 비슷한 원리로 만들어지게 되며 여기에 y변수 히스토그램을 만들 겁니다.

이제 원리는 알았으니 Matplotlib을 이용하여 구현해볼게요~ 먼저 필요한 모듈을 임포트 해줍니다.

이제 산포도에 히스토그램을 추가하는 전체 코드를 살펴보겠습니다. 여기서 설명하지 않는 부분은 주석으로 대체하겠습니다.

앞에서 살펴본 axes 3개를 만들기 위한 시작점, 높이와 폭을 설정하고 리스트로 만들어줍니다. 이때 히스토그램을 그리는 axes와 산포도를 그리는 axes를 분리하기 위한 공간 spacing을 설정해줍니다(line 12).

시작점, 높이와 폭을 설정했지만 아직 공간을 만든 것은 아닙니다. 공간은 plt.axes를 사용하여 만들어줍니다. plt.axes는 좌측 시작 위치, 바닥 시작위치, 폭, 높이를 원소로 갖는 리스트를 인자로 받습니다. 그리고 각 공간에서 눈금이 겹치지 않도록 눈금을 안쪽으로 설정합니다.

이제 각 axes에 산포도와 히스토그램 2개를 그려줍니다. 이때 y변수 히스토그램은 수평으로 그려주도록 합니다(산포도 line 40).

산포도에 히스토그램이 잘 추가된 것을 확인할 수 있습니다.

2. 좀 더 멋지게 꾸미기

1. 그룹 변수가 없는 경우

여기에서는 앞에서 생성한 데이터를 이용하여 앞의 결과를 좀 더 꾸며 보도록 하겠습니다. 꾸미는 요소는 다음과 같습니다.

1. y변수 히스토그램에서 x축 눈금을 0, 50, 100이 아닌 0, 25, 50, 75, 100으로 좀 더 세분화

2. 산포도에 눈금선 추가

3. 히스토그램에 그라데이션 적용

사실 뭔가 새로운 것은 아니고 이전 포스팅에서 다룬 내용을 여기에서 응용한 것입니다. 먼저 히스토그램에 그라데이션을 적용하는 함수를 정의합니다. 히스토그램에 그라데이션을 적용하는 부분은 이전 포스팅에서 다루었으므로 설명은 주석으로 대체합니다.

이제 전체 코드를 살펴보겠습니다. 코드는 앞에서 본 것과 거의 동일하며 산포도 꾸미는 요소만 설명드릴게요.

중앙에 눈금선을 추가합니다. 라인 색상은 회색이며 스타일은 점선으로 설정했습니다.

히스토그램에 그라데이션을 적용합니다.

y 변수 히스토그램의 x축 눈금을 세분화합니다.

아까보다 좀 더 멋진(?) 그림을 얻을 수 있습니다.

2. 그룹 변수가 있는 경우

이번에는 그룹 변수(또는 범주형 변수)가 섞여 있는 경우를 다루어 보도록 하겠습니다. 어렵지 않습니다. 앞에서 살펴본 거에서 코드 몇 줄만 더 추가하면 됩니다. 먼저 데이터를 만들어줄게요. 꽁냥이는 그룹이 3개인 경우를 고려했습니다.

이제 코드를 살펴볼게요. 원리는 동일하므로 달라진 부분만 설명드리겠습니다.

scatter에서 c인자에 그룹별 색상을 지정해줍니다.

그룹별로 히스토그램을 그리기 위해선 그룹 개수만큼 히스토그램을 그려주어야 합니다.

그림이 멋지게 완성되었습니다. 짝짝짝~!!

이번 포스팅에서는 산포도에 히스토그램을 그려보는 산포도 방법에 대해서 알아보았습니다. 이 부분도 시각화에 많이 사용될 수 있으니 알아두시면 반드시 도움이 될 거예요. 다음에도 좋은 주제로 찾아뵐 것을 약속드리며 이상 포스팅 마치겠습니다. 지금까지 꽁냥이의 글 읽어주셔서 감사합니다.


0 개 댓글

답장을 남겨주세요