Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Összefoglalás
Ez a cikk a Microsoft Office Excel 2003 rsQ függvényét és az Excel későbbi verzióit ismerteti. Ez a cikk ismerteti a függvény használatát, és összehasonlítja az RsQ eredményeit az Excel későbbi verzióiban az RSQ eredményeivel az Excel korábbi verzióiban.
További információ
Az RSQ(tömb1, tömb2) függvény a Pearson Product-Moment korrelációs együttható négyzetét adja vissza két adattömb között.
Szemantika
RSQ(array1, array2)
A tömb1 és a tömb2 argumentumnak számoknak vagy neveknek, tömbállandóknak vagy számokat tartalmazó hivatkozásoknak kell lenniük.
Az RSQ leggyakoribb használata két cellatartományt tartalmaz, amelyek tartalmazzák az adatokat, például RSQ(A1:A100, B1:B100).
Példa a használatra
Az RSQ függvény szemléltetéséhez kövesse az alábbi lépéseket:
Hozzon létre egy üres Excel-munkalapot, majd másolja a következő táblázatot.
Egy B C D 1 = 3 + 10^$D$2 10-ből álló teljesítmény az adatokhoz való hozzáadáshoz 2 =4 + 10^$D$2 0 3 =2 + 10^$D$2 4 =5 + 10^$D$2 5 =4+10^$D$2 6 =7+10^$D$2 pre-Excel 2003 =RSQ(A1:A6;B1:B6) ha D2 = 7,5 =PEARSON(A1:A6;B1:B6)^2 RSQ = PEARSON^2 0.492857142857143 =CORREL(A1:A6;B1:B6)^2 CORREL^2 0.509470304975923 ha D2 = 8 RSQ = PEARSON^2 #DIV/0! CORREL^2 0.509470304975923 Jelölje ki az A1 cellát az üres Excel-munkalapon, majd illessze be a bejegyzéseket úgy, hogy a táblázat kitöltse az A1:D13 cellákat a munkalapon.
Miután beillesztte a táblázatot az új Excel-munkalapra, válassza a Beillesztés beállításai gombot, majd válassza a Célformátum egyeztetése lehetőséget. Ha a beillesztett tartomány továbbra is ki van jelölve, használja az alábbi eljárások egyikét, a futtatott Excel-verziónak megfelelően:
- A Microsoft Office Excel 2007-ben válassza a Kezdőlap lapot, a Cellák csoportban a Formátum lehetőséget, majd az Oszlopszélesség automatikus méretezése lehetőséget.
- Az Excel 2003-ban mutasson a Formátum menü Oszlop pontjára, majd válassza az Automatikus méretezés kijelölése lehetőséget.
Megjegyzés:
Érdemes lehet a B1:B6 cellát számként formázni 0 tizedesjegyekkel.
Az A1:A6 és a B1:B6 cella a példában az RSQ, a PEARSON és a CORREL meghívására használt két adattömböt tartalmazza az A8:A10 cellában. Az RSQ kiszámítása lényegében a PEARSON kiszámításával és az eredmény négyzetre emelésével történik. Mivel a PEARSON és a CORREL egyaránt kiszámítja a Pearson Product-Moment korrelációs együtthatót, az eredményeknek meg kell egyezniük. Az RSQ lényegében a CORREL kiszámításaként és az eredmény négyzetre emeléseként is megvalósítható lett volna, de nem így történt.
Az Excel 2003-nál korábbi verzióiban a PEARSON kerekítési hibákat okozhat. Ez a viselkedés kerekítési hibákhoz vezet az RSQ-ban. A PEARSON és így az RSQ viselkedése javult az Excel 2003 és az Excel későbbi verziói esetében. A CORREL mindig az Excel 2003-ban és az Excel későbbi verzióiban található továbbfejlesztett eljárással lett implementálva. Ezért az Excel egy korábbi verziójában az RSQ helyett a CORREL használata ajánlott, majd az eredményt négyzetre kell emelni.
Az Excel 2003-nál korábbi verzióiban a cikkben szereplő munkalapon futtathat egy kísérletet, és felderítheti, hogy mikor fordulnak elő kerekítési hibák. Ha a B1:B6 minden megfigyeléséhez konstanst ad hozzá, az A7:A9 cellában az RSQ, a PEARSON^2 és a CORREL^2 értékek nem lesznek hatással. Ha növeli az értéket a D2-ben, a B1:B6 értékhez egy nagyobb állandó lesz hozzáadva. Ha D2 <= 7, az A7:A9-ben nincsenek kerekítési hibák. Most módosítsa a 7,25, 7,5, 7,75, majd 8 értéket. A CORREL^2 az A9-ben nincs hatás alatt, de az RSQ és a PEARSON^2 (ezek a kifejezések mindig összhangban vannak egymással) az A7:A8-ban kerekítési hibákat mutatnak. A D6:D13 az RSQ = PEARSON^2 és a CORREL^2 értéket jeleníti meg, ha d2 = 7,5 és 8.
Vegye figyelembe, hogy a CORREL továbbra is jól viselkedik, de a PEARSON kerekítési hibái olyan súlyossá váltak, hogy a 0-tal való osztás RSQ-ban és PEARSON^2-ben fordul elő, amikor D2 = 8.
Az Excel korábbi verziói helytelen válaszokat adnak ezekben az esetekben, mivel a kerekítési hibák hatása mélyebb az Excel ezen verziói által használt számítási képlettel. A kísérletben használt esetek azonban szélsőségesnek tekinthetők.
Ha az Excel 2003-at vagy az Excel egy újabb verzióját használja, a kísérlet kipróbálása esetén az RSQ és a PEARSON^2 értékei nem változnak. A D6:D13 cellákban azonban kerekítési hibák jelennek meg, amelyeket az Excel korábbi verzióival kaphatott volna.
Eredmények az Excel korábbi verzióiban
Ha elnevezi a két X és Y adattömböt, az Excel korábbi verziói egyetlen átengedéssel számították ki az X négyzeteinek összegét, az Y négyzeteinek összegét, az X-ek összegét, az Y-k összegét, az XY-k összegét és az egyes tömbök megfigyeléseinek számát. Ezeket a mennyiségeket ezután összevontuk az Excel korábbi verzióiban található súgófájlban megadott számítási képletben. Az RSQ súgófájlja a Pearson Product-Moment korrelációs együttható képletét jeleníti meg. Ez az eredmény négyzetre van emelve az RSQ megkapásához.
Eredmények az Excel 2003-ban és az Excel későbbi verzióiban
Az Excel 2003-ban és az Excel későbbi verzióiban használt eljárás kétirányú folyamatot használ az adatokon keresztül. Először az X és az Y összegét, valamint az egyes tömbökben lévő megfigyelések számát számítjuk ki, és ezekből az X és Y megfigyelések átlaga (átlaga) számítható ki. Ezután a második menetben az X és az X középérték közötti négyzetes különbség jelenik meg, és a négyzetes különbségeket összegzi a rendszer. Az egyes Y és az Y átlag közötti négyzetes különbséget kiszámítjuk, és ezeket a négyzetre emelt különbségeket összegezzük. Emellett a termékek (X – X középérték) * (Y – Y középérték) minden egyes adatpontpárhoz megtalálhatók, és összegezve vannak. Ez a három összeg a PEARSON képletében van kombinálva. Figyelje meg, hogy a három összeg egyikét sem érinti, ha az Y tömb (vagy az X tömb) minden egyes értékéhez hozzáad egy állandót. Ez a viselkedés azért fordul elő, mert ugyanez az érték hozzáadódik az Y középértékhez (vagy az X középértékhez). A numerikus példákban még a D12 cellában lévő 10-nek is nagy a teljesítménye, ez a három összeg nincs hatással, és a második lépés eredményei függetlenek a D2 cella bejegyzésétől. Ezért az Excel 2003-ban és az Excel későbbi verzióiban az eredmények numerikusan stabilabbak.
Összegzés
Az egylépéses megközelítés kétlépéses megközelítéssel történő cseréje garantálja a PEARSON, és így az RSQ jobb numerikus teljesítményét az Excel 2003-ban és az Excel későbbi verzióiban. Az Excel 2003-ban és az Excel későbbi verzióiban beszerzett eredmények soha nem lesznek kevésbé pontosak, mint az Excel korábbi verzióiban kapott eredmények.
A legtöbb gyakorlati példában valószínűleg nem fog különbséget látni az Excel későbbi verzióiban és az Excel korábbi verzióiban megjelenő eredmények között. Ez a viselkedés azért fordul elő, mert a tipikus adatok nem valószínű, hogy a kísérlet által illusztrált szokatlan viselkedést mutatnak. A numerikus instabilitás nagy valószínűséggel az Excel korábbi verzióiban jelenik meg, ha az adatok nagy számú jelentős számjegyet tartalmaznak, és viszonylag kevés eltérést mutatnak az adatértékek között.
A középérték négyzetes eltéréseinek összegének megállapítására szolgáló eljárás a minta középértékének megállapításával, az egyes négyzetes eltérések kiszámításával és a négyzetes eltérések összegzésével pontosabb, mint az alternatív eljárás. Ezt az alternatív eljárást gyakran nevezték "számológép képletnek", mert alkalmas volt számológép használatára néhány adatponton. Az alternatív eljárás a következő eljárást alkalmazta:
- Számítsuk ki az összes megfigyelés négyzeteinek összegét, a mintaméretet és az összes megfigyelés összegét.
- Kiszámítottuk az összes megfigyelés négyzeteinek összegét mínusz ([az összes megfigyelés összege]^2)/mintaméret).
Az Excel 2003-hoz és az Excel későbbi verzióihoz számos más funkció is továbbfejlesztve lett. Ezek a függvények azért továbbfejlesztettek, mert az Excel későbbi verziói lecserélik az egyátadásos eljárást a kétlépéses eljárásra, amely megkeresi a minta középértékét az első meneten, majd kiszámítja a második menetben a minta középértékével kapcsolatos négyzetes eltérések összegét.
Az alábbi lista az ilyen függvények listáját tartalmazza:
- VAR
- VARP
- STDEV
- STDEVP
- DVAR
- DVARP
- DSTDEV
- DSTDEVP
- ELŐREJELZÉS
- LEJTŐ
- FELTARTÓZTAT
- PEARSON
- RSQ
- STEYX
Hasonló fejlesztések történtek az Analysis ToolPak három varianciás eszközének mindegyikében.