간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
수록범위 : 1권1호(1987)~32권5호(2019) |수록논문 수 : 1,844
응용통계연구
32권5호(2019년 10월) 수록논문
최근 권호 논문
| | | |

KCI등재

1종이신문 열독자의 특성이 정기구독 여부에 미치는 영향에 대한 로지스틱 회귀분석

저자 : 이세영 ( Seyoung Lee ) , 김재희 ( Jaehee Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 653-669 (17 pages)

다운로드

(기관인증 필요)

초록보기

뉴미디어의 등장과 발달로 인해, 과거 미디어의 대부분을 차지한 종이신문의 이용량이 점차 줄어들어 종이신문의 정기구독률이 2016년 14%로 매우 저조하게 나타났다. 따라서 본 연구는 종이신문 정기구독 여부에 영향을 미치는 열독자 요인을 파악하고자 수행되었다. 이를 위해 한국 언론 진흥재단의 2016년과 2017년의 언론수용자 의식조사의 자료를 분석에 사용하였다. 열독자의 성별, 연령, 학력, 가구소득, 열독일수, 열독시간, 열독분량을 열독자의 특성으로 지정하였으며, 정기구독 여부에 열독자의 어떠한 특성이 영향을 미치는지 알아보기 위해 다중 로지스틱 회귀를 적합하고 해석하였다.


The development of new media has gradually decreased the use of newspapers, which had previously occupied the largest share of media. Subscriptions have declined gradually and fell to 14 percent in 2016. This study explores the effects of Newspaper reader's characteristics on regular newspaper subscriptions. The data used for analysis was provided by the Korean Press Foundation and Media Audience Awareness Survey Data in 2016 and 2017. We considered gender, age, education, income, number of days of reading, reading time and amount of reading as the characteristics of the reader. Multiple logistic regression was fitted and interpreted to see what characteristics affect regular subscription.

KCI등재

2다변량 시계열 자료를 이용한 부정맥 예측

저자 : 이민혜 ( Minhai Lee ) , 노호석 ( Hohsuk Noh )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 671-681 (11 pages)

다운로드

(기관인증 필요)

초록보기

최근에 부정맥 환자가 증가하면서 머신러닝을 이용한 부정맥을 예측하는 연구가 활발하게 진행되고 있다. 기존의 많은 연구들은 특정한 시점의 RR 간격 데이터에서 추출한 특징변수 다변량 데이터에 기반하여 부정맥을 예측하였다. 본 연구에서는 심장 상태가 시간에 따라 변해가는 패턴도 부정맥 예측에 중요한 정보가 될 수 있다고 생각하여 일정한 시간 간격을 두고 특징변수의 다변량 벡터를 추출하여 쌓음으써 얻어지는 다변량 시계열 데이터로 부정맥을 예측하는 것의 유용성에 대해 살펴보았다. 1-Nearest Neighbor 방법과 그것을 앙상블(ensemble)한 learner를 중심으로 비교했을 경우 시계열의 특징을 고려한 적절한 시계열 거리함수를 선택하여 시계열 정보를 활용한 다변량 시계열 데이터 기반 방법의 분류 성능이 더 좋게 나오는 것을 확인하였다.


Studies on predicting arrhythmia using machine learning have been actively conducted with increasing number of arrhythmia patients. Existing studies have predicted arrhythmia based on multivariate data of feature variables extracted from RR interval data at a specific time point. In this study, we consider that the pattern of the heart state changes with time can be important information for the arrhythmia prediction. Therefore, we investigate the usefulness of predicting the arrhythmia with multivariate time series data obtained by extracting and accumulating the multivariate vectors of the feature variables at various time points. When considering 1-nearest neighbor classification method and its ensemble for comparison, it is confirmed that the multivariate time series data based method can have better classification performance than the multivariate data based method if we select an appropriate time series distance function.

KCI등재

3면대면 강의실 환경에서 전자교과서를 이용한 기초 통계학 수업

저자 : 최숙희 ( Sookhee Choi ) , 한경수 ( Kyungsoo Han )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 683-692 (10 pages)

다운로드

(기관인증 필요)

초록보기

최근에는 기술의 도움 없이 통계를 가르친다는 것은 상상조차 하기 어렵다. 기술의 발전은 기초 통계학을 가르치는 방식과 교과서의 형태를 바꾸고 있다. 거의 모든 학생들이 항상 모바일 기기를 가지고 다니기 때문에 통계학 교과서를 디지털 형태로 제공한다면 학습자는 언제 어디서든 배울 수 있을 것이다. 또한 스마트폰은 학생들이 강의에 더 집중할 수 있도록 수업시간에 질의응답에 사용될 수 있다. 본 논문은 면대면 강의실에서 전자교과서를 이용할 때 발생하는 데이터를 분석하고 향후 전자교과서의 연구 방향을 제안한다.


It is hard to imagine teaching statistics without the help of technology. Technology is changing the way in which the content of introductory statistics is taught and the forms of textbook used. Almost all students carry mobile devices all the time that allows them to learn anytime and anywhere if we provide them with statistical electronic textbook. The use of smartphones for asking questions and finding answers in class, it can encourage students to engage more in lectures. This paper analyzes the data obtained using e-textbook in traditional classroom and discusses the future research direction of e-textbooks.

KCI등재

4절단된 분포를 이용한 인공신경망에서의 초기값 설정방법

저자 : 김민종 ( Minjong Kim ) , 조성철 ( Sungchul Cho ) , 정혜린 ( Hyerin Jeong ) , 이영섭 ( Yungseop Lee ) , 임창원 ( Changwon Lim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 693-702 (10 pages)

다운로드

(기관인증 필요)

초록보기

딥러닝은 대용량의 데이터의 분류 및 예측하는 방법으로 각광받고 있다. 데이터의 양이 많아지면서 신경망의 구조는 더 깊어 지고 있다. 이때 초기값이 지나치게 클 경우 층이 깊어 질수록 활성화 함수의 기울기가 매우 작아지는 포화(Saturation)현상이 발생한다. 이러한 포화현상은 가중치의 학습능력을 저하시키는 현상을 발생시키기 때문에 초기값의 중요성이 커지고 있다. 이런 포화현상 문제를 해결하기 위해 Glorot과 Bengio (2010)과 He 등 (2015) 층과 층 사이에 데이터가 다양하게 흘러야 효율적인 신경망학습이 가능하고 주장했다. 데이터가 다양하게 흐르기 위해서는 각 층의 출력에 대한 분산과 입력에 대한 분산이 동일해야 한다고 제안했다. Glorot과 Bengio (2010)과 He 등(2015)는 각 층별 활성화 값의 분산이 같다고 가정해 초기값을 설정하였다. 본 논문에서는 절단된 코쉬 분포와 절단된 정규분포를 활용하여 초기값을 설정하는 방안을 제안한다. 출력에 대한 분산과 입력에 대한 분산의 값을 동일하게 맞춰주고 그 값이 절단된 확률분포의 분산과 같게 적용함으로써 큰 초기값이 나오는 걸 제한하고 0에 가까운 값이 나오도록 분포를 조정하였다. 제안된 방법은 MNIST 데이터와 CIFAR-10 데이터를 DNN과 CNN 모델에 각각 적용하여 실험함으로써 기존의 초기값 설정방법보다 모델의 성능을 좋게 한다는 것을 보였다.


Deep learning has gained popularity for the classification and prediction task. Neural network layers become deeper as more data becomes available. Saturation is the phenomenon that the gradient of an activation function gets closer to 0 and can happen when the value of weight is too big. Increased importance has been placed on the issue of saturation which limits the ability of weight to learn. To resolve this problem, Glorot and Bengio (Proceedings of the Thirteenth International Conference on Artificial Intelligence and Statistics, 249-256, 2010) claimed that efficient neural network training is possible when data flows variously between layers. They argued that variance over the output of each layer and variance over input of each layer are equal. They proposed a method of initialization that the variance of the output of each layer and the variance of the input should be the same. In this paper, we propose a new method of establishing initialization by adopting truncated normal distribution and truncated cauchy distribution. We decide where to truncate the distribution while adapting the initialization method by Glorot and Bengio (2010). Variances are made over output and input equal that are then accomplished by setting variances equal to the variance of truncated distribution. It manipulates the distribution so that the initial values of weights would not grow so large and with values that simultaneously get close to zero. To compare the performance of our proposed method with existing methods, we conducted experiments on MNIST and CIFAR-10 data using DNN and CNN. Our proposed method outperformed existing methods in terms of accuracy.

KCI등재

5기온변화가 전력수요에 미치는 비선형적 영향: 부분선형모형을 이용한 추정과 예측

저자 : 박지원 ( Jiwon Park ) , 서병선 ( Byeongseon Seo )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 703-720 (18 pages)

다운로드

(기관인증 필요)

초록보기

최근 빈번하게 발생하는 이상기온과 기후변화로 인하여 전력수요의 변동성이 커지고 있으며 기온 영향의 증가와 함께 기온변화에 대한 전력수요의 반응은 비선형성과 비대칭성으로 나타나고 있다. 정부 에너지 정책의 변화와 4차 산업혁명의 전개에 따라 기온 효과를 보다 정확하게 추정하고 예측하는 것은 안정적 전력수급 관리를 위하여 중요한 과제이다. 본 연구는 기온변화에 대한 전력수요의 비선형적 반응에 대하여 부분선형모형을 이용하여 분석하고자 한다. 기온변화와 전력수요의 비선형·비대칭적 관계를 측정하기 위하여 Robinson의 double residual 준모수적 추정과 스플라인 추정을 적용하였다. 기상변수와 전력 소비에 대한 시간 단위 고주기 자료를 사용하여 부분선형모형으로 추정한 기온변화와 전력 소비의 관계는 기존 모수적 모형과는 다른 비선형성과 비대칭성을 갖고 있음을 확인하였다. 부분선형모형을 이용하여 얻은 전력수요에 대한 표본내·표본외 예측은 이차함수 모형과 냉난방도일 모형과 비교하여 우수한 예측력을 보였다. Diebold-Mariano 검정결과, 부분선형모형에서 얻은 예측력 향상은 통계적으로 유의하였다.


The influence of temperature on electricity demand is increasing due to extreme weather and climate change, and the climate impacts involves nonlinearity, asymmetry and complexity. Considering changes in government energy policy and the development of the fourth industrial revolution, it is important to assess the climate effect more accurately for stable management of electricity supply and demand. This study aims to analyze the effect of temperature change on electricity demand using the partial linear model. The main results obtained using the time-unit high frequency data for meteorological variables and electricity consumption are as follows. Estimation results show that the relationship between temperature change and electricity demand involves complexity, nonlinearity and asymmetry, which reflects the nonlinear effect of extreme weather. The prediction accuracy of in-sample and out-of-sample electricity forecasting using the partial linear model evidences better predictive accuracy than the conventional model based on the heating and cooling degree days. Diebold-Mariano test confirms significance of the predictive accuracy of the partial linear model.

KCI등재

6비모수 방법을 사용한 영상 잡음 제거 알고리즘

저자 : 우호영 ( Ho-young Woo ) , 김영화 ( Yeong-hwa Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 721-740 (20 pages)

다운로드

(기관인증 필요)

초록보기

영상처리 분야에서 중요한 분야인 잡음 제거는 통계적인 접근이 필요하지만 잡음에 대한 특정한 분포를 가정하기 어려우며 지역적 특징을 반영하는 공간 필터는 소표본에 해당하므로 모수적인 방법으로 접근할 수 없다. 1차 영상 미분과 2차 영상 미분은 영상에 포함된 잡음 수준에 따라 확연한 차이를 보이며 캐니 에지 검출기를 사용하면 보다 명확히 알 수 있다. 잡음 수준을 통계적으로 확인하고자 Fligner-Killeen 검정을 진행하고 붓스트랩 방법을 사용하였으며 추정된 잡음의 수준을 베타분포의 누적분포함수를 이용하여 0과 1사이의 값을 갖도록 하였다. 본 연구에서는 영상에 포함된 잡음 수준을 고려하는 잡음 제거 알고리즘을 제시하고자 한다.


Noise reduction is an important field in image processing and requires a statistical approach. However, it is difficult to assume a specific distribution of noise, and a spatial filter that reflects regional characteristics is a small sample and cannot be accessed in a parametric manner. The first order image differential and the second order image differential show a clear difference according to the noise level included in the image and can be more clearly understood using the canyon edge detector. The Fligner-Killeen test was performed and the bootstrap method was used to statistically check the noise level. The estimated noise level was set between 0 and 1 using the cumulative distribution function of the beta distribution. In this paper, we propose a nonparametric noise reduction algorithm that accounts for the noise level included in the image.

KCI등재

7연속재평가방법에 가속화 단계를 적용한 MTD 추정법

저자 : 권도희 ( Dohee Kwon ) , 김동재 ( Dongjae Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 741-752 (12 pages)

다운로드

(기관인증 필요)

초록보기

제1상 임상시험의 주목적은 최대허용용량(maximum tolerated dose; MTD)을 결정하는 것이다. MTD 결정을 통해 다음 임상시험에 사용될 용량이 제한되므로 투약용량 발견 시험이라고도 불리며 매우 중요한 단계이다. MTD를 결정하는 방법에는 대표적으로 DM 방법, SM 방법, CRM 방법이 있다. 본 논문에서는 기존 수정된 CRM 방법에 초기가속화 단계를 적용하여 낮은 용량에 다수의 피험자가 할당되는 문제점을 보완하는 새로운 MTD 추정 방법을 제안하였고 기존 방법들과의 비교를 위해 모의실험을 실시하였다.


The purpose of a Phase I Clinical Trial is to determine the maximum tolerated dose (MTD). MTD is important because it affects subsequent clinical trials; however, the existing method has a problem due to an inadequate dose allocated to patients. In this paper, an MTD estimation method is proposed to complement the problems of the existing MTD estimation method. The suggested method applies the initial acceleration step to the modified continual reassessment method. Monte Carlo Simulation Study is adapted to compare a suggested MTD estimation method with the standard design and the modified continual reassessment method.

KCI등재

8지렛대 붓스트랩을 이용한 이변량 구간 중도 절단 자료의 일치성 검정

저자 : 김양진 ( Yang-jin Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 753-761 (9 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 이변량 구간 중도 절단 자료의 연관성 검정을 연구하고자 한다. Kendall's □ 통계량은 분포의 가정을 필요로 하지 않는 비모수방법으로 연관성 검정을 위해 빈번히 적용되고 있다. 본 논문에서도 이러한 □ 통계량을 이용한 검정을 하기 위해 붓스트랩 방법을 적용시킨다. 일반적인 비모수 붓스트랩 방법의 구간 중도 절단에 적용은 편의된 결과를 보여주었다. 이는 구간 중도 절단자료의 불완전성(incompleteness)과 관련된 것으로 이를 극복하기 위해 지렛대 붓스트랩 방법을 적용하였다. 추정된 분포에 근거하여 구간 중도 절단 대신 모의 완전한 표본(pseudo complete data)을 추룰하는 것이다. 본 논문에서는 재표본의 크기 m을 결정하기 위해 기존 연구자의 공식을 이용하였다. 시행된 모의 실험의 결과는 바람직한 제 1종 오류값과 좋은 검정력을 보였주었으며 실제 적용 예로 AIDS자료에서 HIV 감염시점과 바이러스 잠복 시간과의 연관성 여부를 검정해보았다.


A test procedure based on a Kendall's □ statistic is proposed for the association of bivariate interval censored data. In particular, a leverage bootstrap technique is applied to replace unknown failure times and a classical adjustment method is applied for treating tied observations. The suggested method shows desirable results in simulation studies. An AIDS dataset is analyzed with the suggested method.

KCI등재

9용어간 종속성을 이용한 문서 순위 매기기에 의한 확률적 정보 검색

저자 : 유현조 ( Hyun-jo You ) , 이정진 ( Jung-jin Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 5호 발행 연도 : 2019 페이지 : pp. 763-782 (20 pages)

다운로드

(기관인증 필요)

초록보기

텍스트 문서 집합에 대한 정보검색에서는 주어진 질의에 부합하는 각 문서의 적합도 확률을 계산하고 이 확률이 높은 것부터 낮은 순으로 문서 순위를 정하여 사용자에게 제공한다, 각 문서의 적합도 확률 계산에 많이 사용되는 모형은 단어들이 확률적으로 독립이라는 가정 하에 확률을 추정한다. 이 모형은 단어들의 결합 확률을 계산하는 것이 현실적으로 어렵다는 점에서 많이 이용되고 있지만 질의에 사용되는 단어들이 대개 서로 관련성을 가지고 있다는 사실을 고려하고 있지 않다. 본 논문에서는 단어 자질들의 의존 구조를 고려하여 문서의 적합도 확률을 계산하기 위하여 단어들의 결합 패턴의 확률을 다항분포 모형으로 가정하고, 최대 엔트로피 방법으로 확률을 추정하여 문서 순위를 매기는 정보검색 모형을 제안한다. 여러 가지 다항분포 상황에서 시뮬레이션 실험을 한 결과 변수들의 독립을 가정한 모형보다 더 우수한 추정 결과를 보여 준다. 실제 LETOR OHSUMED 데이터 이용한 문서 순위 매기기 실험의 결과도 더 나은 검색 결과를 보여 준다.


This paper proposes a probabilistic document ranking model incorporating term dependencies. Document ranking is a fundamental information retrieval task. The task is to sort documents in a collection according to the relevance to the user query (Qin et al., Information Retrieval Journal, 13, 346-374, 2010). A probabilistic model is a model for computing the conditional probability of the relevance of each document given query. Most of the widely used models assume the term independence because it is challenging to compute the joint probabilities of multiple terms. Words in natural language texts are obviously highly correlated. In this paper, we assume a multinomial distribution model to calculate the relevance probability of a document by considering the dependency structure of words, and propose an information retrieval model to rank a document by estimating the probability with the maximum entropy method. The results of the ranking simulation experiment in various multinomial situations show better retrieval results than a model that assumes the independence of words. The results of document ranking experiments using real-world datasets LETOR OHSUMED also show better retrieval results.

1
권호별 보기
가장 많이 인용된 논문

(자료제공: 네이버학술정보)

가장 많이 인용된 논문
| | | |
1연안해역에서 석유오염물질의 세균학적 분해에 관한 연구

(2006)홍길동 외 1명심리학41회 피인용

다운로드

2미국의 비트코인 규제

(2006)홍길동심리학41회 피인용

다운로드

가장 많이 참고한 논문

(자료제공: 네이버학술정보)

가장 많이 참고한 논문

다운로드

2미국의 비트코인 규제

(2006)홍길동41회 피인용

다운로드

해당 간행물 관심 구독기관

연세대학교 서울대학교 성균관대학교 고려대학교 중앙대학교(서울)
 161
 96
 84
 81
 54
  • 1 연세대학교 (161건)
  • 2 서울대학교 (96건)
  • 3 성균관대학교 (84건)
  • 4 고려대학교 (81건)
  • 5 중앙대학교(서울) (54건)
  • 6 계명대학교 (45건)
  • 7 이화여자대학교 (45건)
  • 8 경희대학교 (37건)
  • 9 부산대학교 (37건)
  • 10 충남대학교 (31건)

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기