데이터 사이이언스 / AI 전문가가 되는 부담없는 첫 시작
지금 메타코드와 함께 시작해보실래요?

    커뮤니티 5천만 전국민 무료코딩교육의 신화! 메타코드

      커뮤니티

      커뮤니티 > 강의 질문
      강의 질문
      공공데이터를 활용한 데이터분석 포트폴리오 만들기 | 소방청 공공데이터 (5강: Seaborn 데이터 시각화 - barplot)
      # # #
      2024-02-26 15:55:47
      추천 1 답변 1 조회 86

      1. 질문 부분 시간 입력 : 14:58

      2. 질문 내용 : 

      sns.barplot(data=df_seoul_pivot, x='발생장소_구', y='사고발생건수', hue='발생장소_구')

      그래프에 평균에 대한 95% 신뢰범위 검은 라인이 생기지 않는 이유가 무엇인가요?

      지눅스 등급 : 실버
      커뮤니티 > 강의 질문
      답변
      Re : 공공데이터를 활용한 데이터분석 포트폴리오 만들기 | 소방청 공공데이터 (5강: Seaborn 데이터 시각화 - barplot)
      2024-02-26 17:32:11
      추천 1

      안녕하세요, 백승림 강사입니다.

      질문주신 내용의 원인은 아래 두 가지 중 하나일 것으로 생각됩니다.

       

      [1. df_seoul_pivot이 잘 정의되어 있는지 확인]

      df_seoul_pivot의 인덱스가 index=['발생장소_구','발생장소_동']로 잘 정의되어 있는지 확인해봅니다.

      강의에서는 데이터가 이중 인덱스로 구성되어 있기 때문에, 발생장소_구별 각 그룹이 명확하게 정의되므로 각 그룹의 평균에 대한 신뢰 구간이 계산되고 표시됩니다.

      만일 인덱스를 '발생장소_구' 하나로만 정의했거나, aggfunc을 다른 함수로 설정하신 경우에는

      데이터를 그룹화하는 데 어려움이 있을 수 있고, 이로 인해 오차 막대가 표시되지 않을 수 있습니다.


       

      [2. 파라미터 직접 지정]

      그래프에 표기되는 검은 라인은 ci라는 파라미터를 통해 조정할 수 있습니다.

      즉, 이 검은 라인을 나타나게 할 수도 있고 없앨 수도 있는데요.

      기본적으로 함께 나타나도록 세팅되어 있으나, 컴퓨터 환경에 따라 seaborn 또는 matplotlib의 설정이 변경되었을 수 있습니다.

      코드에 아래와 같이 ci 파라미터를 직접 지정해보세요.

      sns.barplot(data=df_seoul_pivot, x='발생장소_구', y='사고발생건수', hue='발생장소_구',ci=95)

      그 외에도 ci=90, ci=None 등의 설정으로 변경해보시기를 추천드립니다!


       

      *또한, 추후 seaborn의 ci 파라미터가 사라지고, errorbar 파라미터로 대체될 예정이라는 공지가 있습니다.

      ci=95 대신 errorbar=('ci', 95)로 사용하셔도 좋을 거예요. 그럼 공부 화이팅입니다!

      백승림 등급 : 실버
      데이터 분석가
      지금, 메타코드와 시작해보세요.