Directory UMM :Journals:Journal_of_mathematics:DM:

(1)

Estimaci´

on Param´

etrica de la Funci´

on

de Regresi´

on en un Modelo No Lineal

Parametric Estimation of the Regression Function

in a nonlinear model

Mar´ıa Margarita Olivares (

)

Escuela de Matem´atica. Facultad de Ciencias. U.C.V

Har´

u Martinez (

)

Instituto de Ingenier´ıa Agr´ıcola

Facultad de Agronom´ıa U.C.V.

Abstract

Se construye un estimador paramétrico de la función de regresión en un modelo no lineal basándonos en una técnica de m´ınima distancia utilizada por Beran para estimación de densidades (1977). Obtenemos consistencia y un teorema central del l´ımite para estos estimadores. Palabras Claves: Modelo de Regresión no lineal, m´ınima distancia, estimación.

Abstract

In this paper we construct estimators of the parameter that identi-fies a regression function in the nonlinear regression model using Beran Technique for densities estimation (1977). We give consistency and a central limit theorem for these estimators.

Key words and phrases: Regresion nonlinear model, minimum dis-tance, estimation.

1 Introducci´

on

Consideremos un modelo de uso frecuente en áreas aplicadas, como es el mode-lo de regresión no lineal, el cual consiste en suponer que un conjunto de datos (ti, xi), i= 1,2,· · ·, nverifican la ecuación:

xi=h(ti) +εi

(2)

Los puntos tise consideran determin´ısticos y los εi son variables aleatorias independientes y equidistribuidas. Si se supone que la funci´onh depende de una familia param´etrica, es decir:

h(t) =h(t, θ) con θ_∈Rp

un problema importante se refiere a obtener estimadores del par´ametro θ

a partir de las observaciones. Para obtener tales estimadores y demostrar su comportamiento asintótico aplicamos una técnica de m´ınima distancia utiliza-da por Beran (1977) para presentar los estimadores de distancia de Hellinger m´ınima en la estimación de densidades. Este método de m´ınima distancia fue desarrollado por J. Wolfowitz (1957) y ha sido ampliamente usado pa-ra obtener estimadores fuertemente consistentes de funciones de distribución, densidades y de regresión.

En regresión, Pak (1996) usa la técnica de Beran (1977), considerando un modelo de regresión lineal y la distancia de Hellinger. Construye estimadores de densidad basados en los errores estandarizados y sobre estos usa la distancia de Hellinger.

En este trabajo se aplica de una forma diferente el procedimiento de Beran (1977) en la funci´on regresora y considerando que ´esta no es una densidad, se utiliza la distancia usual deL2_[0_,_1]_._{Para el estimador planteado se demuestra}

su consistencia y se establece un Teorema Central del L´ımite.

Preliminares y Resultados.

En lo que sigue se considera el modelo de regresi´on:

xni =h(tni) +εi, i= 1, ..., n y tni ∈(0,1)

con εi variables aleatorias independientes e id´enticamente distribuidas tales queE(εi) = 0 yE¡

ε2

i

¢

=σ2_.

La verdadera funci´on regresora h_∈L2_[0_,_{1] es desconocida, y asumimos}

que pertenece a una familia

F=_{kf(θ, k) : _kf(θ, k)_k₂= 1 , θ_∈Θ, k_∈I_}

donde Θ es un conjunto compacto de Rp, I es un intervalo compacto de R, k k2 representa la normaL2[0,1].

Siguiendo un enfoque an´alogo al utilizado por Beran (1977) para presentar los funcionales de distancia de Hellinger m´ınima, estimamos el par´ametro

θ∈Θ y estimamosk=khk2valiéndonos de una estimación no paramétrica

ˆ

(3)

Para estimarθdefiniremos los siguientes operadores parag∈L2[0,1]

T(g) = arg t_∈Θ

m´ın_kkf(t, k)₋g_k₂

ˆ

Tn(g) = arg t_∈Θ

m´ın°°

°ˆknf(t,ˆkn)−g ° ° ° 2

donde ˆkn es el estimador de k = kgk2. Bajo hip´otesis de regularidad de

la familia _F, demostramos que para g _∈ L2_[0_,_1]_,_ˆ_g

n el estimador de g no param´etrico:

1. T(ˆgn)_→T(g) en probabilidad

2. √n(T(ˆgn)₋T(g)) _{→ N}D ³0, σ2R1 0 ρg(t)ρ

T g(t)dt

´

donde _→D, significa convergencia en distribuci´on, ρg es una funci´on vectorial definida en [0,1] que depende de g y ρT

g es su traspuesta , N es la distribuci´on normal.

3. ˆk2

n→k2en probabilidad. 4. √n³ˆk2

n−k2

´ _D

→ N(0,4σ2R1 0

g2₍_t₎_dt₎

5. ∧kn→k en probabilidad.

6. √n

µ_∧

kn−k

¶

D

→ N(0, σ2_{) note que la distribuci´on no depende de}

kg_k₂

7. √n³Tˆ(ˆgn)−T(g)

´ _D

→ N£

0, V(σ2_{, g}₎¤

, donde

V(σ2_{, g}_{) =}_σ2R1 0

ρg(t)ρT g(t)dt+

σ2

kgk2 1 R

0

ρg(t)hT(f, θ0, k, g)g(t)dt+ σ 2

kgk2 1 R

0

h(f, θ0, k, g)ρTg(t)g(t)dt+

σ2_h₍_{f, θ}

0, k, g)hT(f, θ0, k, g)kgk₂

dondeh(f, θ0, k, g) es un vector enRp yhT es su traspuesta.

Se supondrán ciertas las siguientes hipótesis e introducimos las definiciones y notaciones dadas a continuación.

(4)

Se considera el modelo de regresi´on:

xn

i =h(tni) +εi, i= 1, ..., n y tni ∈(0,1)

con εi variables aleatorias independientes e id´enticamente distribuidas tales queE(εi) = 0 yE¡

ε2

i

¢

=σ2_.

H1 La verdadera funci´on regresorah_∈L2_[0_,_{1] es desconocida, y asumimos}

que pertenece a una familia

F={kf(θ, k) : kf(θ, k)k2= 1 , θ∈Θ, k∈I}

donde Θ es un conjunto compacto de Rp_{, I} _{es un intervalo compacto} deR,_{k k}₂representa la norma dos deL2_[0_,_1]

H2 f(t, k) es continua en cada uno de los par´ametros,t_∈Θ, k∈I,bajo la norma deL2_[0_,_1]

H3 f•(t, k) y ••f(t, k) representan la primera y segunda derivada respecto a

t∈Θ def, ∂ •

f(t,k)

∂k continua en [0,1], k∈I.

H4 _F satisface la siguiente condici´on: si θ1, θ2 ∈ Θ, θ1 6= θ2,entonces

f(θ1, k)6=f(θ2, k),para cadak∈I.

H5 Ag(t, k) =

1 R

0

••

f(x;t, k)g(x)dxes una matrizp_×pno singular,t_∈Int(Θ).

H6 ρg(x) =−A−g1(θ0, k)

•

f(x;θ0, k), x∈[0,1], ρg∈C2[0,1].

H7 _N(µ, V) representa la distribuci´on Normal de mediaµy varianzaV.

H8 f(t, k) y f•(t, k) admiten el siguiente desarrollo de Taylor de primer orden, parat_∈int(Θ):

f(x;t+αe, k) =f(x;t, k) +αeT_f•₍_x_;_t_{, k}_{) +}_αeT_U₍_α_;_x_);_x_∈_[0_,_1]

•

f(x;t+αe, k) =f•(x;t, k) +α•f.•(x;t,k)e+αV(α;x)e;x_∈[0,1]

donde

• ees un vector columna unitario en la norma Euclidiana deRp

(5)

• f• es un vectorp_×1 que representa las derivadas parciales de 1er orden def(t, k) con respecto a laspvariables del vectort_∈Rp_.

• ••f(x;t, k) es una matr´ızp_×pque representa las derivadas parciales de segundo orden de la funci´onf(x;t, k) con respecto a laspvariables del vectort∈Rp.

• U(α;x) (vectorp×1) yV(α;x) (matriz p×p) son tales que cada una de sus componentes tienden a cero enL2[0,1] cuando α→0.

Definici´on 1. Denotaremos por g∧n(z),un estimador no param´etrico de g∈

L2_[0_,_1]_,_{definido en Gasser y M¨}_{uller (1979), como:}

∧ gn(z) =

1

b(n) n

X

j=1 Z snj

sn j−1

w

µ_z

−s b(n)

¶

x¡

tnj

¢

ds (1)

donde

• ©

sn j

ª

j=0,...,n es una sucesi´on creciente tal que:

sn

0 = 0, snj−1≤tnj ≤snj, j= 1, ..., n−1, snn= 1 m´ax

1≤j≤n

¯

¯sn_j −sn_j₋₁−_n1 ¯ ¯=O

¡₁

na

¢

, a >1.

• w es un n´ucleo de orden d= 2, es decir, w tiene soporte compacto en

[−c, c],

c

Z

−c

w(x)dx= 1,

c

Z

−c

xw(x)dx= 0,

c

Z

−c

x2w(x)dx₆= 0.

• wes Lipschitz de ordenνw= 1.

• {b(n)}n∈N satisface: _nl´ım_→∞b(n) = 0y _nl´ım_→∞

√_{n b}₍_n_{) =} ∞.

• g es dos veces diferenciable con segunda derivada continua en(0,1).

Gasser y M¨uller(1979) demuestran que este estimador posee buenas pro-piedades, tales como:

• Consistencia en error medio cuadr´atico: para todo x_∈(0,1) l´ım

n→∞E[ˆgn(x)−g(x)]

2

(6)

• Consistencia en error medio cuadr´atico integrado:

l´ım n→∞

Z 1

0

Ehg∧n(x)₋g(x)i2dx= 0 (2)

• La velocidad de convergencia del error medio cuadr´atico integrado:

R1

0 E[ˆgn(x)−g(x)] 2

dx= σ2 nb(n)

c

R

−c

w2₍_x₎_dx₊

1

d!2b 2d₍_n₎

Ã

c

R

−c

w(x)xd_dx

!2

·

1 R

0 ¡

g(d)₍_x₎¢2

dx+

◦³ 1

na_b₍_n₎+_n2_b12₍_n₎ ´

+_◦³bd_n(n)+_◦(bd₍_n₎₎´_{, a >}₁_{, d}_{= 2} (3)

Antes de enunciar los teoremas y hacer las demostraciones vamos a de-mostrar los siguientes lemas para obtener el comportamiento asint´otico del vector aleatorio Zn(ρ),ρ:R→Rm_{, m}_≥₁

Zn(ρ) =

√ n b(n)

n

X

j=1

εj

( Z 1

0

ρ(t)

" Z snj

sn j−1

w

µ

t−s b(n)

¶

ds

#

dt

)

(4)

el cual es centrado pues E(εj) = 0, j = 1,2,_{· · ·} , n; donde, en particular, si

ρ:R→Rp _es

ρ(t) =ρg(t) =−A−g1(θ0, k)

•

f(t;θ0, k)

se obtiene la distribuci´on asint´otica de

√

n(T(ˆgn)−T(g)) y también obtendremos la distribución asintótica de

√

n³Tˆ(ˆgn)₋T(g)´ y√n³kˆn−k

´

a partir deZn(ρ).

Lema 1. Sea ρ: R→Rm_{, m}_≥₁_, _{con segunda derivada continua en} _[0_,_1]_,

w es un n´ucleo de orden d= 2, continuo en Ry tiene soporte compacto en

[₋c, c], Zn(ρ)es el vector aleatorio definida en (4) entonces 1. Zn(ρ) =Yn(ρ) +Hn(ρ),

(7)

Yn(ρ) =√nPn

Demostraci´on: Usando Fubini, cambio de variable, el hecho que w es a soporte compacto y teorema de valor medio para integrales, obtenemos que paran_≥N0

, mediante el desarrollo de Taylor de ρ alrededor deξn j,

por ser wun n´ucleo obtenemos la descomposici´on

Zn(ρ) =√nPn

para demostrar queHn(ρ) tiende a cero en probabilidad hacemos el desarrollo

(8)

casi siempre, pues por la Ley fuerte de los grandes números, se desprende que Yn(ρ) y Zn(ρ) son asintóticamente equivalentes, es decir, tienen la misma distribución asintótica.

Yn(ρ) es centrado,V ar((Yn(ρ))) =E¡(Yn(ρ))(YT

dondeK es constante, usando la continuidad deρy considerando quea >1, tenemos que

Lema 2. Bajos las hip´otesis del Lema 1

(9)

Demostraci´on:Zn(ρ) es asint´oticamente equivalente aYn(ρ),puesHn(ρ)→0 en probabilidad; si demostramos que

Yn(ρ)→N

·

0, σ2 Z 1

0

ρ(t)ρT(t)dt

¸

obtendremos el resultado paraZn(ρ).

Puesto que

Yn(ρ) =√n n

X

j=1

εjρ(ξnj)

£

sn j −snj−1

¤

para obtener la normalidad asint´otica deYn(ρ), demostremos que para todo vectory_∈Rm _{no nulo}

hYn(ρ), yi →N£

0, σ2(y)¤

por las propiedades del producto escalar

hYn(ρ), yi= n

X

j=1

εjanj(y)

donde

anj(y) =√n

ρ(ξjn), y

® £

snj −snj−1 ¤

;ξnj ∈

¡

snj −snj−1 ¢

Si

Xnj(y) =εjanj(y) ySn(y) =V ar(hYn(ρ), yi) =σ2 n

X

j=1

a2_nj(y)

hYn(ρ), yi= n

X

j=1

Xnj(y)

probaremos a continuaci´on quehYn(ρ), yisatisface la condici´on de Lindeberg (Billingsley, 1968), esto es :

1

Sn(y) n

X

j=1 Z

n

Xnj(y)≥ε√Sn(y)

oX 2

nj(y)dP→0 , para cadaε >0

Sea ε >0, comoR

ε2jdP<∞,

existeR >0 tal que

Z

{ε2

j≥εσ2R}

(10)

existeN1 tal que para cadan≥N1 se tiene

Por otro lado: n

lo. As´ı tenemos que:

a2

concluyendo que paran≥N1

(11)

Lema 3. Siρy g ∈C2[0,1]yw es un n´ucleo de orden 2, entoncesZn(ρ)es asint´oticamente equivalente a:

√ n

Z 1

0

ρ(t) [ˆgn(t)−g(t)]dt

(es decir, sus distribuciones l´ımites son las mismas)

Demostraci´on:SeaI1(n) =√nR

Si en I11,aplicamos el Teorema del valor medio, existe λjn ∈

£

,aplicando el desarrollo de Taylor a la funci´onρ′_{alrededor de}_sn

(12)

dondeνn

Adem´as, por el teorema del valor medio para integrales y por el desarrollo de Taylor, existen ̟jn∈

¡

sn j, snj−1

¢

y αjn entretnj y ̟jn tales que la expresi´on

I12 satisface:

kI12k ≤ √n

El enfoque que seguiremos ser´a an´alogo al utilizado por Beran (1977) para presentar los funcionales de distancia de Hellinger m´ınima.

(13)

puede que existan varios θ ∈Θ donde se alcance el m´ınimo, tomaremos uno cualquiera de ´estos.

Bajo las hipótesis generales impuestas a la familia de funciones _F, se puede garantizar que el funcionalT además de estar bien definido es continuo en la métrica deL2_[0_,_{1] , como se verá en los siguientes teoremas:}

Teorema 1. Bajo la hip´otesis (H2), existeT(g)para todo g_∈L2_[0_,_1]_.

Demostraci´on: Seanp(t, k) =kkf(t, k)−gk2 y{tn} ⊂Θ , tal quetn →t de la desigualdad

|p(tn, k)−p(t, k)| ≤ |k| kf(tn, k)−f(t, k)k2→0 cuandon→ ∞

concluimos que p(t, k) es continua en t , para k fijo y para cada t _∈ Θ , como este conjunto es compacto en Rp, entonces tenemos que existe θ0 tal

quep(θ0, k) es m´ınimo, con lo cual se garantiza la existencia deT(g)

Teorema 2. Supongamos que T(g) es ´unica y que se cumple la hip´otesis (H4), entonces

1. T es continua

2. T(kf(θ, k) ) =θunicamente para´ θ _∈Θ, k fijo.

Demostraci´on:1) Seangnyg∈L2[0,1] tales quekgn−gk2→0 , definimos

pn(t, k) =_kkf(t, k)₋gnk2 yp(t, k) =kkf(t, k)−gk2 conk fijo, ¯

¯ ¯ ¯

M in

t_∈Θpn(t, k)−M int_∈Θp(t, k) ¯ ¯ ¯ ¯≤

Sup

t_∈_Θ|

pn(t, k)₋p(t, k)_{| ≤}Sup

t_∈_Θk

gn−gk2→0

por lo tantopn(θn, k)→p(θ0, k) donde

θn=T(gn) = arg m´ın t_∈_Θ k

kf(t, k)₋gnk2

θ0=T(g) = arg m´ın t_∈Θ k

kf(t, k)₋g_k₂

Falta demostrar que la sucesi´on_{θn} converge a θ0.Supongamos queθn no converge aθ0, como Θ es compacto , existe una subsucesi´on

©

θnj

ª

⊂ {θn} tal que θnj → θ1 con θ0 distinto a θ1, luego por ser p(t, k) continua en t,

p¡

θnj, k

¢

→ p(θ1, k) y por la unicidad del l´ımite tenemos que p(θ1, k) =

p(θ0, k) = l´ım

n→∞p(θn, k), lo cual es una contradicci´on, ya que hemos supuesto

queT(g) es ´unico (el m´ınimo se alcanza en un ´unicoθ0).

2) T(kf(θ0, k)) =θ0es inmediato por la hip´otesis de identificaci´on sobre los

(14)

Teorema 3. Bajo las siguientes hip´otesis:

• f(t, k)satisface las hip´otesis (H2,H3,H8)

• El par´ametrok es fijo (conocido)

• T(g)existe, es ´unica y pertenece alInt(Θ). • T es continua en la m´etrica de L2[0,1].

•

1 R

0

••

f(x;t, k)g(x)dxsatisface la hip´otesis (H5).

• gn ,g∈L2[0,1],kgn−gk2→0

Entonces

θn−θ0=

−

· R1

0

••

f (x;θ0, k)g(x) dx ¸−1

R1 0

•

f(x;θ0, k) [gn(x)−g(x)] dx +anR

1 0

•

f(x;θ0, k) [gn(x)−g(x)] dx

donde an es una matriz p×p tal que sus componentes tienden a cero

cuando n_{→ ∞}.

Demostraci´on:Por definici´on:

kkf(t, k)₋g_k2₂ =

Z 1

0 £

k2f2(x;t, k)₋2kf(x;t, k)g(x) +g2(x)¤

dx

= k2₋2k

Z 1

0

f(x;t, k)g(x) dx+

Z 1

0

g2(x) dx

como para gfija yk fija, las expresiones

kkf(t, k)₋g_k2₂ y ₋2k

Z 1

0

f(x;t, k)g(x) dx

alcanzan el m´ınimo en el mismo puntot, entonces trabajaremos con la segunda expresi´on.

DefinimosH(k,t) =₋2kR1

0 f(x;t, k)g(x) dx, luego usando (H8)

l´ım α→0

H(k,t+αe)−H(k,t)

α =−2k

Z 1

(15)

para cualquiere vectoreyt_∈int(Θ),comokkf(t, k)−gk22 alcanza un m´ınimo

ent=θ0 obtenemos:

Z 1

0

•

f(x;θ0, k)g(x) dx=0

de igual manera,

Z 1

0

•

f(x;θn, k)gn(x) dx=0

de esta ´ultima expresi´on y (H8):

R1 0

•

f(x;θ0, k)gn(x) dx+α

R1 0

••

f (x;θ0, k)e gn(x) dx+

αR1

0 V(α;x)e gn(x) dx=0

siαe=θn−θ0 ynes suficientemente grande

(θn−θ0) =

−

½Z 1

0 ••

f(x;θ0, k) g(x) dx

¾−1_Z 1

0 •

f(x;θ0, k) [gn(x)−g(x)]dx

+an

Z 1

0 •

f(x;θ0, k) [gn(x)−g(x)]dx

donde:

an=−

½ R1

0

••

f (x;θ0, k) g(x) dx ¾−1

An

½ R1

0

••

f (x;θ0, k) g(x) dx ¾−1

+

Rn

½ R1

0

••

f (x;θ0, k) g(x) dx ¾−1

,

conAn =

· R1

0

••

f (x;θ0, k) [gn(x)−g(x)]dx+R

1

0 V(α;x)gn(x) dx ¸

Ahora bien, el primer sumando enan yRn dependen de :

Z 1

0

••

f (x;θ0, k) [gn(x)−g(x)]dx+

Z 1

0

V(α;x)gn(x) dx

(16)

Usando Cauchy-Schwart y considerando que (gn−g) L2

→ 0 tenemos que el primer sumando tiende a cero y por otro lado, por hip´otesis cada componente deV(α;·)L

2

→0 , de aqu´ı el segundo sumando tambi´en converge a cero, por lo quean→0 yRn→0.

Teorema 4. Seagˆn definida en (1),entonces:

1) ˆgn L 2

→g(en probabilidad)

2) T(ˆgn)_→T(g)(en probabilidad). Demostraci´on:1) Sea

kgˆn−gk22= Z 1

0

[ˆgn(t)−g(t)]2dt

la desigualdad de Chebichev, Fubbini y (2) aseguran que

P[_kgˆn−gk2≥ε] ≤

1

ε2E h

kgˆn−gk22 i

=

1

ε2E ·Z 1

0

(ˆgn(t)₋g(t))2dt

¸

= 1

ε2 Z 1

0

Eh(ˆgn(t)−g(t))2

i

dt_→0

2) por el resultado anterior y por serT continuaT(ˆgn)→T(g) en proba-bilidad.

Teorema 5. Siρg ,g ∈C2[0,1]y wes un n´ucleo de orden 2 entonces

√

n[T(ˆgn)₋T(g)]_{→ N}D

·

0, σ2

Z 1

0

ρg(t)ρTg (t)dt

¸

Demostraci´on:

√_n_[_T_(ˆ_g_n)

−T(g)] =√nR1

0 ρg(t) [ˆgn(t)−g(t)]dt+

√_na

nR

1 0

•

f(t;θ0, k) [ˆgn(t)−g(t)]dt=I1(n) +I2(n)

por el Teorema 3

El primer sumando, que denotamos por I1(n) es asint´oticamente

equiva-lente aZn(ρg) por el Lema 3, dondeZn(ρg) converge a

N

·

0, σ2

Z 1

ρg(t)ρTg (t)dt

(17)

Resta ver que el segundo sumandoI2(n) converge a cero en probabilidad:

I2(n) =√nan

Z 1

0

•

f(t;θ0, k) [ˆgn(t)−g(t)]dt=anWn

donde Wn por el Lema 3, es asint´oticamente equivalente aZn(

•

f(θ0, k)) que

converge en distribuci´on a

N

·

0, σ2

Z 1

0

ρ(t)ρT(t)dt

¸

ρ=f•(θ0, k), θ0=T(g) yanconverge a cero, por lo queIn(2) converge a cero en probabilidad.

Estimaci´on de _kgk2

Sea ˆgn el estimador de la funci´ong dado por Gasser y Muller, definido en (1)

Usaremos el siguiente estimador de la norma deg:

ˆ

k2n=

1 Z

0

ˆ

g2n(t)dt

y sea

k2=

1 Z

0

g2(t)dt

Los siguientes teoremas nos aseguran la consistencia de este estimador y la distribuci´on l´ımite.

Teorema 6. Bajo las hip´otesis consideradas en la Definici´on 1

• ˆk2

n→k2en probabilidad.

• √n³ˆk2

n−k2

´ _D

→ N(0,4σ2R1 0

g2₍_t₎_dt₎_.

Demostraci´on:

¯ ¯ ¯ˆk

2

n−k2

¯ ¯ ¯=

¯ ¯ ¯ ¯ 1 R

0

ˆ

g2

n(t)dt−

1 R

0

g2₍_t₎_dt ¯ ¯ ¯ ¯

=

¯ ¯ ¯ ¯ 1 R

0

(ˆgn(t)−g(t))2dt+ 2

1 R

0

g(t)(ˆgn(t)−g(t))dt

¯ ¯ ¯ ¯≤ 1

R

0 |

ˆ

gn(t)₋g(t)_|2dt+ 2

1 R

0 |

(18)

Usando el Teorema de Fubini,

E



 1 Z

0

|ˆgn(t)−g(t)|2dt



=

1 Z

0

E(|gˆn(t)−g(t)|2)→0 por (2)

de aqu´ı se deduce la convergencia en probabilidad a cero de

1 Z

0

|gˆn(t)₋g(t)_|2dt

Por otro lado,

1 Z

0

|g(t)_{| |}ˆgn(t)₋g(t)_|dt_{≤ k}g_k₂



 1 Z

0

|gˆn(t)₋g(t)_|2



 1 2

→0

en probabilidad, se concluye que

P³¯¯ ¯ˆk

2

n−k2

¯ ¯ ¯≥ε

´

→0

con lo cual queda demostrada la consistencia del estimador.

Para obtener la convergencia d´ebil del estad´ıstico, lo expresamos como:

√_n³

ˆ

k2

n−k2

´

=√n



 1 Z

0

(ˆgn(t)₋g(t))2_dt_{+ 2} 1 Z

0

g(t)(ˆgn(t)₋g(t))dt





sea

I1(n) = 2√n 1 R

0

g(t)(ˆgn(t)−g(t))dt

I2(n) =√n 1 R

0

(ˆgn(t)₋g(t))2_dt

El t´ermino

I1(n) = 2Zn(g) + 2√n 1 Z

0

g(t)





1

b(n) n

X

j=1

w(t−s

b(n))g(t n

j)ds−g(t)



dt

usando la definici´on de ˆgn,dondeZn(g) est´a definido en (4), conρ(t) =g(t),en este caso, del Lema 2, se obtiene que

Zn(g)→ ND (0, σ2

1 Z

(19)

y de manera an´aloga a la demostraci´on del Lema 2 se obtiene que el otro sumando que define I1(n) tiende a cero sin→ ∞.

Falta estudiar ´unicamente el t´ermino

I2(n) =√n 1 Z

0

(ˆgn(t)−g(t))2dt

Por (3):

R1

0 E[ˆgn−g(t)]

2

dt=_nbσ₍2_n₎ c

R

−c

w2(x)dx+

1 4b(n)

4 Ã

c

R

−c

w(x)x2_dx !2

·

1 R

0 ¡

g(2)₍_t₎¢2_dt₊

o³_na_b1₍_n₎+

1

n2_b₍_n₎2 ´

+_◦³b2_n(n)+_◦(b(n)2₎´_{, a >}₁

de aqu´ı se obtiene que

√ n

Z 1

0

E[ˆgn−g(t)]2→0.

El b(n) optimal (Gasser y M¨uller,1979) es un o((1/n)2d1+1), con d = 2 en nuestro caso.

Corolario 3. Bajo las hip´otesis consideradas en la Definici´on 1 se obtiene que:

• ˆkn→ken probabilidad

• √n³ˆkn−k

´ _D

→ N(0, σ2₎ _{, el l´ımite no depende de}

kg_k₂.

Demostraci´on:kˆn−k= ˆ

k2

n−k2 ˆ

kn+k

→0 en probabilidad y

√_n³

ˆ

kn−k

´

=√nkˆ

2

n−k2 ˆ

kn+k

→N(0,

4σ2R1 0

g2 (t)dt

4k2 ) =N(0, σ 2₎_.

Distribuci´on l´ımite de Tˆn(ˆgn) Definimos

ˆ

Tn(g) = arg m´ın θ∈Θ

° °

°kˆnf(θ,kˆn)−g ° ° ° 2

ˆ

θn= ˆTn(ˆgn) = arg m´ın θ∈Θ

° °

°ˆknf(θ,ˆkn)−ˆgn ° ° ° 2

θ0=T(g) = arg m´ın

θ∈Θ k

(20)

donde

1 Z

0

f2(x;θ, k)dx= 1

para todok_∈I,para todoθ_∈Θ.

Teorema 7. Bajo la hip´otesis (H2), Tˆn(g)existe casi siempre para toda g_∈ L2_[0_,_1]_.

Demostración:La demostración es idéntica a la del Teorema 1

Teorema 8. Supongamos queTˆn(ˆgn)es única casi siempre,T es única, que la familia _F satisface las hipótesis (H2) y (H4), entonces

ˆ

θn→θ0en probabilidad.

Demostración: Para hacer una demostración análoga a la del Teorema 2 , demostraremos que

l´ım

n→∞p(ˆkn, θ) =p(k, θ) en probabilidad,

donde

p(ˆkn, θ) =

° °

°kˆnf(θ,ˆkn)−

∧ gn

° ° ° 2

p(k, θ) =kkf(θ, k)−gk2

En efecto, por propiedades del valor absoluto y de la norma,

¯ ¯

¯p(ˆkn, θ)−p(k, θ) ¯ ¯ ¯≤

¯ ¯ ¯ˆkn

¯ ¯ ¯ ° °

°f(θ,kˆn)−f(θ, k) ° ° °₂+

¯ ¯ ¯ˆkn−k

¯ ¯

¯+kˆgn−gk2→0

en probabilidad.

Usando el argumento de unicidad de ˆTnyTde manera an´aloga a la demos-traci´on del Teorema 2, obtenemos la consistencia del estimador ˆTn(ˆgn).

Distribuci´on L´ımite de√n³Tˆn(ˆgn)−T(g)

´

.

Obtendremos una expresi´on para ˆθn−θ0que nos permita estudiar la

dis-tribuci´on asint´otica del estad´ıstico:

√

n³Tˆn(ˆgn)−T(g)

´

.

(21)

Teorema 9. Supondremos que f(t, k) verifica (H2,H3,H8),bajo la hipótesis (H5), T(g) existe, es única y pertenece al int(Θ),Tˆn(ˆgn) existe y es única

casi siempre, entonces

ˆ

θn−θ0=− ½

R1 0

••

f(x;θ0,ˆkn)g(x) dx ¾−1

R1 0

•

f(x;θ0,ˆkn) [ˆgn(x)−g(x)] dx

+

½ R1

0

••

f ³x;θ0,ˆkn

´

g(x) dx

¾−1 R1

0 µ_•

f(x;θ0,kˆn)−

•

f(x;θ0, k) ¶

g(x)dx+

an

R1 0

•

f(x;θ0,ˆkn) [ ˆgn(x)−g(x)]dx+

anR

1 0

µ_•

f(x;θ0,ˆkn)−

•

f(x;θ0, k) ¶

g(x)dx

donde

an=−

½Z 1

0

••

f(x;θ0,kˆn)g(x) dx ¾−1

An

½Z 1

0

••

f(x;θ0,kˆn)g(x) dx ¾−1

+Rn

½Z 1

0

••

f(x;θ0,ˆkn)g(x) dx

¾−1

An=

Z 1

0

••

f(x;θ0,kˆn)(ˆgn(x)−g(x))dx+

Z 1

0

V(α, x)ˆgn(x)dx_→0,

casi siempre, sin_{→ ∞}y el t´erminoRn depende deAn.

Demostraci´on: Por el mismo argumento utilizado en la demostraci´on del Teorema 3, se obtienen las siguientes ecuaciones:

Z 1

0

•

f(x;θ0, k)g(x) dx=0

Z 1

0

•

f³x; ˆθn,ˆkn

´

ˆ

gn(x) dx=0, casi siempre

de la hipótesis H8 y esta última expresión

R1 0

•

f(x;θ0,kˆn)ˆgn(x) dx+α

R1 0

••

f(x;θ0,ˆkn)eˆgn(x) dx+

αR1

0 V(α;x)eˆgn(x) dx=0

(22)

½Z 1

0

••

f(x;θ0,kˆn)ˆgn(x) dx+

Z 1

0

V(α;x) ˆgn(x) dx

¾_³

ˆ

θn−θ0 ´

= ₋

Z 1

0

•

f(x;θ0,ˆkn)ˆgn(x) dx

puesto que R1 0

••

f(x;θ0,ˆkn)g(x) dx es no singular, casi siempre

ˆ

θn−θ0=− ½

R1 0

••

f(x;θ0,ˆkn)g(x) dx ¾−1

R1 0

•

f(x;θ0,ˆkn) [ˆgn(x)−g(x)] dx

+

½ R1

0

••

f ³x;θ0,ˆkn

´

g(x) dx

¾−1 R1

0 µ_•

f(x;θ0,kˆn)−

•

f(x;θ0, k) ¶

g(x)dx+

anR

1 0

•

f(x;θ0,ˆkn) [ ˆgn(x)−g(x)]dx+

anR₀1

µ_•

f(x;θ0,ˆkn)−

•

f(x;θ0, k) ¶

g(x)dx

dondean, AnyRnverifican las expresiones dadas en el enunciado del teorema.

Teorema 10. Bajo las hip´otesis (H2,H3,H5), si f(t, k) verifica (H8), T(g)

existe, es ´unica y pertenece al int(Θ),Tˆn(ˆgn)existe y es ´unica casi siempre,

entonces el estad´ıstico:

√

n³θˆn−θ0 ´

es asint´oticamente equivalente a

Zn(ρg) +h(f, θ0, k, g)·2√n 1 Z

0

g(t) (ˆgn(t)−g(t))dt

donde Zn(ρ)est´a definido en (4),ρg(t)en (H6) y

h(f, θ0, k, g) =−A−g1(θ0, k) Z 1

0

∂ ∂k

•

f(x;θ0, k)g(x)dx

es un vector p_×1.

Demostraci´on:Por el Teorema 9

√

n³θˆn−θ0 ´

(23)

donde

Estudiaremos por separado cada uno de los sumandos:

I1(n) es asint´oticamente equivalente aZn(ρg),por Lema 3, corolario 3 e y Corolario 3I2(n) es asint´oticamente equivalente a

½

Puesto que I3(n) es asint´oticamente equivalente a:

anZn(

donde an → 0 en probabilidad

¯

Corolario 4. Bajo las hip´otesis del teorema anterior, el estad´ıstico

√

(24)

es asint´oticamente equivalente a

Ln=√n n

X

j=1

εj

µ

ρg(ξn

j) + 2h(f, θ0, k, g)

g(ηn j)

k

¶ ¡

sn j −snj−1

¢

dondeξn j, ηnj ∈

£

sn j −snj−1

¤

Demostraci´on:Por el Teorema 10,

√

n³θˆn−θ0 ´

es asint´oticamente equivalente a

Zn(ρg) +h(f, θ0, k, g)·2√n 1 Z

0

g(t)³g∧n(t)−g(t)

´

dt

donde

h(f, θ0, k, g) =− ·Z 1

0

••

f(x;θ0, k)g(x)dx ¸−1Z 1

0

∂ ∂k

•

f(x;θ0, k)g(x)dx

y por el Lema 1,Zn(ρg) es asint´oticamente equivalente a

Yn(ρ) =√n

n

X

j=1

εjρ(ξjn)

¡

sn j −snj−1

¢

, ξn j ∈

£

sn j −snj−1

¤

, ρ=ρg

y por otro lado, para ρ = g, h(f, θ0, k, g)·2√n 1 R

0

g(t)³g∧n(t)−g(t)´dt es asint´oticamente equivalente a

2h(f, θ0, k, g)Yn(g) = 2h(f, θ0, k, g) √

n

X

j=1

εj

g(ηn j)

k ¡

snj −s n j−1

¢ , ηnj ∈

£ snj −s

n j−1

¤

por Lema 3 y Lema 1, de donde se obtiene el resultado

Teorema 11. Si ρg y g son continuas y denotamos por V ar(Ln) la matriz

de varianzas y covarianza de Ln

(25)

donde

Lim(n) =Ai(n)_·Am(n)

Ai(n) =

"

√_n n

P

j=1

εj

³

ρi

g(ξjn) +hi(f, θ0, k, g)

g(ηn j)

k

´_¡

sn j −snj−1

¢ #

,

ξn j, ηnj ∈

¡

sn j −snj−1

¢

entonces:

E(Lim(n))_n→ →∞σ

2R1

0

ρi

g(t)ρmg(t)dt+

σ2

kgk2 1 R

0

ρi

g(t)hm(f, θ0, k, g)g(t)dt+ σ 2

kgk2 1 R

0

hi₍_{f, θ}

0, k, g)ρmg (t)g(t)dt+

σ2_hi₍_{f, θ}

0, k, g)hm(f, θ0, k, g)kgk2

donde ρi

g(t) es la componente idel vector ρg(t) y hi(f, θ0, k, g) es la

compo-nenteidel vector h(f, θ0, k, g).

Demostraci´on: Puesto que m´ax j

°

°sn_j −sn_j₋₁−_n1 °

° = O

¡1

na

¢

para a > 1,

usando la continuidad de ρg y deg, y el hecho que las variables aleatorias

εj, j= 1,2,· · · , nson independientes, centradas y de varianzaσ2:

E(Lim(n)) =nσ2 Pn

j=1

Bi(n)Bm(n)¡

sn j −snj−1

¢2

Bi(n) =³ρi

g(ξjn) +hi(f, θ0, k, g)

g(ηn j)

k

´

E(Lim(n))_n→ →∞σ

2 1 Z

0

ρig(t)ρmg(t)dt+

σ2 kg_k₂

1 Z

0

ρig(t)hm(f, θ0, k, g)g(t)dt+ σ 2

kg_k₂

1 Z

0

hi(f, θ0, k, g)ρgm(t)g(t)dt+

σ2_hi₍_{f, θ}

0, k, g)hm(f, θ0, k, g)kgk2

Teorema 12. Si ρg yg son continuas

Ln → ND

£

(26)

donde

V(σ2_{, g}_{) =}_σ2R1 0

ρg(t)ρT g(t)dt+

σ2

kgk2 1 R

0

ρg(t)hT₍_{f, θ}

0, k, g)g(t)dt+ σ 2

kgk2 1 R

0

σ2_h₍_{f, θ}

0, k, g)hT(f, θ0, k, g)kgk2

Demostraci´on:Sea y∈Rpun vector no nulo, probaremos que

< Ln, y >→ ND

£

0, V(σ2, g, y)¤

< Ln, y >= n

X

j=1

εjanj(y)

usando las propiedades del producto escalar, donde

an(j) =√n

·

< ρg(ξn

j), y >+<h(f, θ0, k, g), y >

g(ηn j)

k

¸ ¡

sn j −snj−1

¢

.

Si

cnj(y) =εjanj(y), Sn(y) =V ar(< Ln, y >),

entonces tenemos que

< Ln, y >= n

X

j=1

cnj(y),

probaremos a continuaci´on que< Ln, y >satisface la condici´on de Lindeberg, esto es:

1

Sn(y) n

X

j=1 Z

n

cnj(y)≥ε√Sn(y)

ocnj(y)dP→0 , para cadaε >0,

la demostraci´on es an´aloga a la del Lema 2, para concluir que

hLn, yi

p

VhLn, yi

→N[0,1]

esto es, Ln converge en ley a una distribuci´on normal.

Corolario 5. Bajo las hip´otesis del Teorema 10 y siρg y g son continuas

√

n³θˆn−θ0 ´ _D

→ N£

(27)

donde

V(σ2_{, g}_{) =}_σ2R1 0

ρg(t)ρT g(t)dt+

σ2

kgk2 1 R

0

ρg(t)hT₍_{f, θ}

0, k, g)g(t)dt+ σ 2

kgk2 1 R

0

σ2_h₍_{f, θ}

0, k, g)hT(f, θ0, k, g)kgk2

Referencias

[1] Beran, Rudolf. (1977), Minumun Hellinguer distance estimates for para-metric models, The Annals of Statistics,5, 445–463.

[2] Billingsley, Patric. (1968), Convergence of probability measures. John Wi-ley.

[3] Gasser, Theo. Muller, Hars-Georg. (1979), Kernel estimation of regression functions. Lectures Notes in Mathematics.757. 23–68

[4] Pak, J. (1996). Minimun Hellinguer distance estimation in simple linear regression model; distribution and efficiency. Statistics & Probability Let-ters.26.263–269.

Directory UMM :Journals:Journal_of_mathematics:DM:

Estimaci´

on Param´

etrica de la Funci´

on

de Regresi´

on en un Modelo No Lineal

Parametric Estimation of the Regression Function

in a nonlinear model

Mar´ıa Margarita Olivares (

[email protected]

)

Har´

u Martinez (

[email protected]

)

1

Introducci´

on

Referencias