per
دانشگاه پیام نور
دوفصلنامه گستره علوم آماری
2476-3632
2016-11-21
1
2 (بهار و تابستان 1395)
7
14
3210
Scientific Research
مقایسۀ کارایی روشهای ردهبندیکننده رگرسیون لجستیک و رگرسیون درختی برای متغیر وابسته باینری
Performance Comparison of Logistic Regression and Classification Regression tree Models for Binary Dependent Variable
علیرضا پاکگهر
a_pakgohar@pnu.ac.ir
1
مربی، آمار، دانشگاه پیام نور
در این مقاله میزان کارایی مدلهای ردهبندی رگرسیون لجستیک باینری و رگرسیون درختی روی متغیر وابسته باینری بررسی میشود. شیوۀ پردازش مدل، استفاده از تمام دادهها در مرحلۀ آموزشی است. مجموعه دادههای مورد مطالعه از یک گزارش مطالعاتی دربارۀ سوابق بیماری زردی به دست آمده است که یک مجموعه داده شامل متغیرهای کمی و کیفی است. میزان کارایی دو روش طبقهبندیکننده رگرسیون لجستیک و رگرسیون ردهبندی درخت تصمیم، بر اساس معیارهای کارایی آماری نظیر دقت، توجه به موارد خاص، و تحلیل حساسیت است. نتایج تجربی ما نشان میدهد که رگرسیون لجستیک، دقت بالای 83% و رگرسیون درختی میزان دقت حدود 73% را بر روی مجموعه نشان دادهاند. به همین ترتیب میزان حساسیت رگرسیون لجستیک باینری برابر 77% و رگرسیون درختی برابر 66% است. همچنین اندازه توجه به موارد خاص مدل رگرسیون برابر 85% وبرای رگرسیون درختی برابر 76% است. نتایج کارایی مدل نشان میدهد رگرسیون لجستیک باینری بهتر از رگرسیون درختی عمل کرده است.
This paper describes the performance analysis of two classifier models common in statistics and data mining on binary dependent variable, binary Logistic Regression (B.LR) and Classification Regression Tree (CART). The evaluation method is using all data in training stage. The using data set is from “Evaluation of patients with Jaundice on children” report. Data set is collection of categorical and continues independent variables. The classification performance of two classifiers is presented by using statistical performance measures like accuracy, specificity and sensitivity. Experimental result showed that accuracy of LR is more than 83% and CLASSIFICATION AND REGRESSION TREE is nearly 73%. So the sensitivity measure for BINARY LOGISTIC REGRESSION is nearby 77% and 66% for CLASSIFICATION AND REGRESSION TREE as well the specificity scale is 85% for BINARY LOGISTIC REGRESSION and 76% for CLASSIFICATION AND REGRESSION TREE. The result shows the performance of BINARY LOGISTIC REGRESSION classifier is found to be better than CLASSIFICATION AND REGRESSION TREE.
https://stat.journals.pnu.ac.ir/article_3210_d10de1c40fe98f274d9e5938973979c9.pdf
داده کاوی
رگرسیون لجستیک
رگرسیون درختی
دقت
حساسیت و مشخصه بودن
Data Mining
Binary Logistic Regression
Classification Regression tree
Accuracy
sensitivity
Specificity
per
دانشگاه پیام نور
دوفصلنامه گستره علوم آماری
2476-3632
2016-11-21
1
2 (بهار و تابستان 1395)
15
30
3211
Scientific Research
قضیة باسو در آزمون فرضیههای آماری
Basu's Theorem in Statistical Testing Hypotheses
مهدی شمس
mehdi_shams1357@yahoo.com
1
استادیار، آمار، دانشگاه کاشان
در برخی مسائل آماری از جمله آزمون فرضیهها نیاز به وجود اثبات استقلال دو آمارۀ کمکی و آمارۀ بسنده کامل داریم. با استفاده از قضیة باسو بدون این که توزیع توﺃم دو آماره محاسبه شوند، با داشتن شرایط لازم وجود این استقلال ثابت میشود. در این مقاله به بیان کاربردهایی از این قضیه در آزمون فرضیههای آماری میپردازیم. پیدا کردن توزیع نسبت درستنمایی تعمیم یافته و پرتوانترین آزمونهای یکنواخت نااریب، استقلال نسبتهای درستنمایی برای آزمونهای مرکب و آزمونهای مدلهای اقتصادسنجی میتواند چند مورد از کاربردهای این قضیه باشد. در پایان به طور مختصر شبیهسازی آزمون فرضیهها بیان میگردد.
In some statistical problems we need independence of two statistic, especially in testin hypotheses. With Basu's theorem, we can proof independence of two statistic without calculate their joint ditributions. In this paper we will give applications of this theorem in statistical testin hypothese as GLRT, UMPUT, independens LRT in Compound Tests, and testing of Econometric Models.
https://stat.journals.pnu.ac.ir/article_3211_adbf4e51f89e482e6457768181b71b9b.pdf
قضیة باسو
توزیع نسبت درستنمایی تعمیم یافته
پرتوانترین آزمونهای یکنواخت نااریب
آزمونهای مرکب
Basu's Theorem
GLRT Distribusion
UMPUT
Compound Tests
per
دانشگاه پیام نور
دوفصلنامه گستره علوم آماری
2476-3632
2016-11-21
1
2 (بهار و تابستان 1395)
31
38
3212
Scientific Research
برآوردگر موجکی تابع چگالی احتمال و مشتقات آن برای متغیرهای تصادفی سانسورشده تحت وابستگی منفی تعمیم یافته
Wavelet-based Estimator for Derivatives of Density Function for Censored and Extended Negatively Dependent Observations
نرگس حسینیون
mails.students@gmail.com
1
استادیار، آمار، دانشگاه پیام نور
نظریۀ موجکها شاخهای از تحلیل هارمونیک و از پدیدههای جدید علم ریاضی است که کاربردهای زیادی در ریاضیات و آمار و سایر علوم دارد. این نظریه علی رغم عمر کوتاه خود، به سرعت رشد کرد و تقریباً در هر زمینهای که تحلیل فوریه حضور داشته، به رقابت با آن برخاسته است. در این مقاله یک برآورد ناپارامتری برای تابع چگالی احتمال و مشتقات آن براساس روش موجک برای متغیرهای تصادفی سانسور شده تحت وابستگی منفی تعمیم یافته ارائه میدهیم و به بررسی ویژگیهای آن در فضای بسوف میپردازیم. نشان میدهیم برآوردگر معرفی شده دارای نرخ بهینۀ همگرایی برآوردگرهای موجک، تحت زیان است.
Wavelet Analysis is a branch of Harmonic Analysis and a new phenomenon of Mathematics science which offers wide range of application in Mathematics, Statistics and other fields. Wavelets analysis is finding a rapidly growing number of applications despite its young age and often replacing the conventional Fourier transform. Basically in this paper, the problem of estimating a density and its derivatives for a sample of censored random variables is considered. The purpose of this paper is to present an approach to this problem based on wavelets methods for extended negatively dependent observations. Besides, we explore its performances under the risk in Besov ball.
https://stat.journals.pnu.ac.ir/article_3212_49beef69e292b9c19cdff269fe47c5a4.pdf
آنالیز چندریزگی
برآوردگر موجک
فضای بسوف
مشاهدات سانسور شده
وابستگی منفی تعمیم یافته
Multiresolution Analysis
Wavelet estimator
Besov Space
Censored Data
Extended Negatively Dependent
per
دانشگاه پیام نور
دوفصلنامه گستره علوم آماری
2476-3632
2016-11-21
1
2 (بهار و تابستان 1395)
39
48
3213
Scientific Research
روش نمونهگیری ترابرشی خطی: تابع تشخیص و آزمون فرضیه پارامتری
Line Transect Sampling: Detection Function and Parametric Hypothesis Testing
ابوذر بازیاری
ab_bazyari@yahoo.com
1
استادیار، آمار، دانشگاه خلیج فارس، بوشهر
نمونهگیری ترابرشی خطی یک روش بسیار مفید برای برآورد تابع چگالی جمعیت در علم زیست شناسی است. در این مقاله، ابتدا به معرفی روش نمونهگیری ترابرشی خطی پرداخته شده و سپس آزمون فرضیه پارامتری برای تابع چگالی نیم نرمال در مقابل تابع چگالی نمایی یک متغیره در روش نمونهگیری ترابرشی خطی در نظر گرفته شده است. آماره آزمون با استفاده از روش نسبت درستنمایی محاسبه شده است. به دلیل ساختار پیچیده آماره آزمون، محاسبه توزیع آن تحت فرضیه صفر و نیز تعیین مقادیر بحرانی آن کار سادهای نخواهد بود، بنابراین از روش شبیه سازی مونت کارلو برای یافتن مقادیر بحرانی آماره آزمون در سطوح مختلف معناداری استفاده شده است. با مثالهای عددی این مسئله آزمون مورد بررسی قرار گرفته است.
Line transect sampling is a very helpful method for estimating the density function of population in biology. In this paper, first the line transect sampling is introduced and then parametric hypothesis testing for half normal density function against univariate exponential density function in line transect sampling was considered. The test statistics is obtained using likelihood ratio method. Computing the null distribution of test statistic and its critical values is not easy because of the complexity of test statistic structure, therefore Monte carlo simulation was used for finding the critical values of test statistic at different significance levels. This problem of testing was investigated with numerical examples.
https://stat.journals.pnu.ac.ir/article_3213_23f3188cb4440294ba464be39d13c716.pdf
آزمون فرضیه پارامتری
تابع چگالی نیم نرمال
شبیهسازی مونت کالو
نمونهگیری ترابرشی خطی
Parametric Hypothesis Testing
Half Normal Density Function
Monte carlo simulation
Line Transect Sampling
per
دانشگاه پیام نور
دوفصلنامه گستره علوم آماری
2476-3632
2016-11-21
1
2 (بهار و تابستان 1395)
49
54
3214
Scientific Research
چند جملهایهای استرلینگ و کاربرد آنها در حل انتگرالها
Sterling Polynomials and their Application in Solving Integrals
شهرام یعقوبزاده شهرستانی
yagoubzade@gmail.com
1
مربی، آمار، دانشگاه پیام نور
در این مقاله ابتدا چندجملهایهای استرلینگ معرفی و روش محاسبه آنها در نرمافزار R و کاربردشان در حل ردهای از انتگرالها را بیان میکنیم که در محاسبه گشتاورها، گشتاورهای آمارههای مرتب، آنتروپیهای رنی و شانون و... در توزیعهای آماری بر حسب این نوع انتگرالها، نقش بسزایی دارد. سپس با استفاده از آن، گشتاورهای دو توزیع آماری مرتبط با این انتگرالها را به دست میآوریم.
This article first introduces the sterling polynomials and expresses the calculation methods in software R and their application in resolving a class of integrals which play an important role in the calculation of torques, torques of order statistics, Renyi and Shannon entropies in statistical distributions based on this type of integrals. Then, we obtain the torques of the two statistical distributions related to these integrals.
https://stat.journals.pnu.ac.ir/article_3214_0e95147dae5c210b0e44f52b62258f7f.pdf
چند جملهایهای استرلینگ
انتگرال
گشتاورها
Sterling Polynomials
Integral
Moments
per
دانشگاه پیام نور
دوفصلنامه گستره علوم آماری
2476-3632
2016-11-21
1
2 (بهار و تابستان 1395)
55
62
3215
Scientific Research
توزیع وایبل کوماراسوامی
Kumaraswamy Weibull Distribution
فریبا نظری
darvin2020@yahoo.com
1
انوشیروان غفاریپور
2
کارشناسی ارشد، آمار، دانشگاه پیام نور
استادیار، ریاضی، دانشگاه یاسوج
در این مقاله به معرفی توزیع وایبل کوماراسوامی و بیان برخی از ویژگیهای این توزیع میپردازیم. این توزیع یک مدل کاملاً منعطف در تحلیل دادههای مثبت است. توزیع وایبل کوماراسوامی شامل زیرمدلهای خاص از جمله توزیعهای وایبل نمایی شده، رایلی نمایی شده، نمایی نمایی شده، وایبل و همچنین توزیع جدید نمایی کوماراسوامی است. عبارات صریح برای گشتاورها، تابع مولد گشتاورها و همچنین نتایجی از شبیهسازی بر روی توزیع را ارائه میدهیم.
In this article, we introduce the Kumaraswamy Weibull distribution and discuss some features of this distribution. That is a quite flexible model in analyzing positive data. It contains special sub-models the exponentiated Weibull, exponentiated Rayleigh,exponentiated exponential,Weibull and also the new Kumaraswamy exponential distribution, Explicit Expressions for moments, moment generating function, and also we present the results of the simulation on the distribution.
https://stat.journals.pnu.ac.ir/article_3215_9ba9170bfd37e93e33a456526646470a.pdf
توزیع کوماراسوامی
توزیع وایبل
نرخ شکست
Kumaraswamy distribution
Weibull distribution
failure rate
per
دانشگاه پیام نور
دوفصلنامه گستره علوم آماری
2476-3632
2016-11-21
1
2 (بهار و تابستان 1395)
63
68
3216
Scientific Research
معرفی شبه فضای احتمال و بررسی شبه تابع مولد گشتاور و ویژگیهای آن
Introduction of Pseudo-Probability Space and Studying of Pseudo-Moment Generator Function and Its Properties
لیدر نوایی
leadernavaei@yahoo.com
1
استادیار، آمار، دانشگاه پیام نور
در این مقاله پس از معرفی شبه فضای احتمال، برای اولین بار شبه تابع مولد گشتاور را معرفی میکنیم و به بررسی ویژگیهای آن میپردازیم. همچنین برخی ویژگیهای شبه امید ریاضی و شبه واریانس را مورد بررسی قرار خواهیم داد.
In this paper for the first time we introduce the Pseudo-moment generator function and also we investigate some properties of. . We prove some properties of Pseudo-expectation and Pseudo-dispersion .
https://stat.journals.pnu.ac.ir/article_3216_daff95c2f4736c3f317fe70892ab45b4.pdf
شبه فضای احتمال
شبه تابع مولد گشتاور
شبه امید ریاضی
Pseudo - Probability
Pseudo - Moment Generator Function
Pseudo-Expectation
per
دانشگاه پیام نور
دوفصلنامه گستره علوم آماری
2476-3632
2016-11-21
1
2 (بهار و تابستان 1395)
69
73
3217
Scientific Research
بررسی عملکرد دو روش پیشبینی دادههای فضایی
Studying of two Spatial Data Prediction Methods Performances
روشنک علی محمدی
r_alimohammadi@alzahra.ac.ir
1
صدیقه خندان
sedighekhandan@gmail.com
2
دانشیار، آمار، دانشگاه الزهرا
کارشناسی ارشد، آمار، دانشگاه الزهرا
ساختار وابستگی دادههای فضایی با موقعیت و فاصله بین آنها مرتبط است؛ لذا تحلیل دادههای فضایی دارای کاربردهای متعددی در زمینههای کاربردی است. در این پژوهش به مطالعۀ دو روش درونیابی فضایی یعنی کریگینگ معمولی و عام پرداخته میشود. بدین منظور، به شبیهسازی مجموعههای دادهها پرداخته، عملکرد هر یک از این روشها تحت شرایط مورد نظر، ارزیابی میشود. همچنین، برای بررسی اثر اندازه نمونههای مختلف و توابع تغییرنگار متفاوت، دادهها با اندازههای نمونه و تغییرنگارهای متفاوت شبیهسازی شدهاند. علاوه بر این، برای هر یک از مجموعه دادههای شبیهسازی شده از معیارهای اعتبارسنجی متقابل برای مقایسه این دو روش استفاده شده است. به عنوان ارائه کاربردی از نتایج حاصل، دقت روشهای مورد نظر در برآورد مقادیر مربوط به یک معدن استفاده شده است.
Correlation structure of spatial data is related to their positions and distances. Then spatial data analysis has various applications in applied areas. In this research, we study two spatial interpolation methods, that is Ordinary Kriging and Universal Kriging. In this purpose, data sets are simulated and the performance of each of the methods is studied under the considered conditions. Besides, different sample sizes and variograms is considered to assess the effects of various sample sizes and different vaiogram functions. Furthermore, for every set of simulated data, cross validation criteria is applied to compare the methods. As an application of the results, the methods are applied for data of a mine.
https://stat.journals.pnu.ac.ir/article_3217_f58fdd65d18cc36e195fbad6ccd46874.pdf
دادههای فضایی
کریگینگ معمولی
کریگینگ عام
اعتبارسنجی متقابل
spatial data
Ordinary Kriging
Universal Kriging
Cross Validation