ó
    Z– j3¥  ã                   ó:  • S r SSKrSSKrSSKJr  SSKJrJrJr  SSKJ	r
  SSKJr  SSKJr  SS	KJrJrJrJrJr  SS
KJr  SSKJr  SSKJrJr  SSKJr  \R<                  " \5      r  " S S\RB                  5      r" " S S\RB                  5      r# " S S\RB                  5      r$ " S S\RB                  5      r% " S S\RB                  5      r& " S S\RB                  5      r' " S S\RB                  5      r( " S S\5      r) " S S \RB                  5      r* " S! S"\RB                  5      r+\ " S# S$\5      5       r,\ " S% S&\,5      5       r-\" S'S(9 " S) S*\,5      5       r.\ " S+ S,\,5      5       r/ " S- S.\RB                  5      r0\ " S/ S0\,5      5       r1/ S1Qr2g)2zPyTorch LiLT model.é    N)Únn)ÚBCEWithLogitsLossÚCrossEntropyLossÚMSELossé   )Úinitialization)ÚACT2FN)ÚGradientCheckpointingLayer)ÚBaseModelOutputÚBaseModelOutputWithPoolingÚQuestionAnsweringModelOutputÚSequenceClassifierOutputÚTokenClassifierOutput)ÚPreTrainedModel)Úapply_chunking_to_forward)Úauto_docstringÚloggingé   )Ú
LiltConfigc                   óF   ^ • \ rS rSrU 4S jr    SS jrS rS rSrU =r	$ )ÚLiltTextEmbeddingsé)   c                 ó
  >• [         TU ]  5         [        R                  " UR                  UR
                  UR                  S9U l        [        R                  " UR                  UR
                  5      U l	        [        R                  " UR                  UR
                  5      U l        [        R                  " UR
                  UR                  S9U l        [        R                  " UR                  5      U l        U R#                  S[$        R&                  " UR                  5      R)                  S5      SS9  UR                  U l        [        R                  " UR                  UR
                  U R*                  S9U l	        g )N©Úpadding_idx©ÚepsÚposition_ids©r   éÿÿÿÿF)Ú
persistent)ÚsuperÚ__init__r   Ú	EmbeddingÚ
vocab_sizeÚhidden_sizeÚpad_token_idÚword_embeddingsÚmax_position_embeddingsÚposition_embeddingsÚtype_vocab_sizeÚtoken_type_embeddingsÚ	LayerNormÚlayer_norm_epsÚDropoutÚhidden_dropout_probÚdropoutÚregister_bufferÚtorchÚarangeÚexpandr   ©ÚselfÚconfigÚ	__class__s     €Úw/root/GenerationalWealth/GenerationalWealth/venv/lib/python3.13/site-packages/transformers/models/lilt/modeling_lilt.pyr#   ÚLiltTextEmbeddings.__init__*   s  ø€ Ü‰ÑÔÜ!Ÿ|š|¨F×,=Ñ,=¸v×?QÑ?QÐ_e×_rÑ_rÑsˆÔÜ#%§<¢<°×0NÑ0NÐPV×PbÑPbÓ#cˆÔ Ü%'§\¢\°&×2HÑ2HÈ&×J\ÑJ\Ó%]ˆÔ"äŸš f×&8Ñ&8¸f×>SÑ>SÑTˆŒÜ—z’z &×"<Ñ"<Ó=ˆŒð 	×ÑØœEŸLšL¨×)GÑ)GÓH×OÑOÐPWÓXÐejð 	ñ 	
ð
 "×.Ñ.ˆÔÜ#%§<¢<Ø×*Ñ*¨F×,>Ñ,>ÈD×L\ÑL\ñ$
ˆÕ ó    c                 ó$  • UcI  Ub5  U R                  XR                  5      R                  UR                  5      nOU R	                  U5      nUb  UR                  5       nOUR                  5       S S nUc8  [        R                  " U[        R                  U R                  R                  S9nUc  U R                  U5      nU R                  U5      nXF-   nU R                  U5      nXx-  nU R                  U5      nU R                  U5      nXs4$ )Nr    ©ÚdtypeÚdevice)Ú"create_position_ids_from_input_idsr   Útor@   Ú&create_position_ids_from_inputs_embedsÚsizer3   ÚzerosÚlongr   r(   r,   r*   r-   r1   )	r7   Ú	input_idsÚtoken_type_idsr   Úinputs_embedsÚinput_shaper,   Ú
embeddingsr*   s	            r:   ÚforwardÚLiltTextEmbeddings.forward>   s  € ð ÑØÑ$à#×FÑFÀy×RbÑRbÓc×fÑfØ×$Ñ$ó ‘ð  $×JÑJÈ=ÓYàÑ Ø#Ÿ.™.Ó*‰Kà'×,Ñ,Ó.¨s°Ð3ˆKàÑ!Ü"Ÿ[š[¨¼E¿J¹JÈt×O`ÑO`×OgÑOgÑhˆNàÑ Ø ×0Ñ0°Ó;ˆMØ $× :Ñ :¸>Ó JÐØ"Ñ:ˆ
à"×6Ñ6°|ÓDÐØÑ)ˆ
à—^‘^ JÓ/ˆ
Ø—\‘\ *Ó-ˆ
ØÐ'Ð'r<   c                 ó´   • UR                  U5      R                  5       n[        R                  " USS9R	                  U5      U-  nUR                  5       U-   $ )zë
Args:
Replace non-padding symbols with their position numbers. Position numbers begin at padding_idx+1. Padding
symbols are ignored. This is modified from fairseq's `utils.make_positions`.
    x: torch.Tensor x:
Returns: torch.Tensor
r   ©Údim)ÚneÚintr3   ÚcumsumÚtype_asrF   )r7   rG   r   ÚmaskÚincremental_indicess        r:   rA   Ú5LiltTextEmbeddings.create_position_ids_from_input_idsb   sP   € ð |‰|˜KÓ(×,Ñ,Ó.ˆÜ$Ÿ|š|¨D°aÑ8×@Ñ@ÀÓFÈ$ÑNÐØ"×'Ñ'Ó)¨KÑ7Ð7r<   c                 ó  • UR                  5       SS nUS   n[        R                  " U R                  S-   X0R                  -   S-   [        R                  UR
                  S9nUR                  S5      R                  U5      $ )z®
Args:
We are provided embeddings directly. We cannot infer which are padded so just generate sequential position ids.:
    inputs_embeds: torch.Tensor
Returns: torch.Tensor
Nr    r   r>   r   )rD   r3   r4   r   rF   r@   Ú	unsqueezer5   )r7   rI   rJ   Úsequence_lengthr   s        r:   rC   Ú9LiltTextEmbeddings.create_position_ids_from_inputs_embedso   s~   € ð $×(Ñ(Ó*¨3¨BÐ/ˆØ% a™.ˆä—|’|Ø×Ñ˜qÑ  /×4DÑ4DÑ"DÀqÑ"HÔPU×PZÑPZÐcp×cwÑcwñ
ˆð ×%Ñ% aÓ(×/Ñ/°Ó<Ð<r<   )r-   r1   r   r*   r,   r(   )NNNN)
Ú__name__Ú
__module__Ú__qualname__Ú__firstlineno__r#   rL   rA   rC   Ú__static_attributes__Ú__classcell__©r9   s   @r:   r   r   )   s+   ø† õ
ð, ØØØô"(òH8÷=ð =r<   r   c                   ó2   ^ • \ rS rSrU 4S jrSS jrSrU =r$ )ÚLiltLayoutEmbeddingsé   c                 óž  >• [         TU ]  5         [        R                  " UR                  UR
                  S-  5      U l        [        R                  " UR                  UR
                  S-  5      U l        [        R                  " UR                  UR
                  S-  5      U l        [        R                  " UR                  UR
                  S-  5      U l	        UR                  U l        [        R                  " UR                  UR
                  UR                  -  U R                  S9U l        [        R                  " UR
                  UR
                  UR                  -  S9U l        [        R"                  " UR
                  UR                  -  UR$                  S9U l        [        R&                  " UR(                  5      U l        g )Né   r   )Úin_featuresÚout_featuresr   )r"   r#   r   r$   Úmax_2d_position_embeddingsr&   Úx_position_embeddingsÚy_position_embeddingsÚh_position_embeddingsÚw_position_embeddingsr'   r   r)   Úchannel_shrink_ratioÚbox_position_embeddingsÚLinearÚbox_linear_embeddingsr-   r.   r/   r0   r1   r6   s     €r:   r#   ÚLiltLayoutEmbeddings.__init__€   s^  ø€ Ü‰ÑÔô &(§\¢\°&×2SÑ2SÐU[×UgÑUgÐklÑUlÓ%mˆÔ"Ü%'§\¢\°&×2SÑ2SÐU[×UgÑUgÐklÑUlÓ%mˆÔ"Ü%'§\¢\°&×2SÑ2SÐU[×UgÑUgÐklÑUlÓ%mˆÔ"Ü%'§\¢\°&×2SÑ2SÐU[×UgÑUgÐklÑUlÓ%mˆÔ"à!×.Ñ.ˆÔÜ')§|¢|Ø×*Ñ*Ø×Ñ &×"=Ñ"=Ñ=Ø×(Ñ(ñ(
ˆÔ$ô
 &(§Y¢YØ×*Ñ*¸×9KÑ9KÈv×OjÑOjÑ9jñ&
ˆÔ"ô Ÿš f×&8Ñ&8¸F×<WÑ<WÑ&WÐ]c×]rÑ]rÑsˆŒÜ—z’z &×"<Ñ"<Ó=ˆr<   c                 ó‚  •  U R                  US S 2S S 2S4   5      nU R                  US S 2S S 2S4   5      nU R                  US S 2S S 2S4   5      nU R                  US S 2S S 2S4   5      nU R                  US S 2S S 2S4   US S 2S S 2S4   -
  5      nU R	                  US S 2S S 2S4   US S 2S S 2S4   -
  5      n	[
        R                  " UUUUUU	/SS9n
U R                  U
5      n
U R                  U5      nX«-   n
U R                  U
5      n
U R                  U
5      n
U
$ ! [         a  n[        S5      UeS nAff = f)Nr   r   é   r   z;The `bbox` coordinate values should be within 0-1000 range.r    rO   )rk   rl   Ú
IndexErrorrm   rn   r3   Úcatrr   rp   r-   r1   )r7   Úbboxr   Úleft_position_embeddingsÚupper_position_embeddingsÚright_position_embeddingsÚlower_position_embeddingsÚerm   rn   Úspatial_position_embeddingsrp   s               r:   rL   ÚLiltLayoutEmbeddings.forward•   st  € ð	cØ'+×'AÑ'AÀ$ÂqÊ!ÈQÀwÁ-Ó'PÐ$Ø(,×(BÑ(BÀ4ÊÊ1ÈaÈÁ=Ó(QÐ%Ø(,×(BÑ(BÀ4ÊÊ1ÈaÈÁ=Ó(QÐ%Ø(,×(BÑ(BÀ4ÊÊ1ÈaÈÁ=Ó(QÐ%ð !%× :Ñ :¸4ÂÂ1ÀaÀ¹=È4ÒPQÒSTÐVWÐPWÉ=Ñ;XÓ YÐØ $× :Ñ :¸4ÂÂ1ÀaÀ¹=È4ÒPQÒSTÐVWÐPWÉ=Ñ;XÓ YÐä&+§i¢ià(Ø)Ø)Ø)Ø%Ø%ðð ñ
'
Ð#ð '+×&@Ñ&@ÐA\Ó&]Ð#Ø"&×">Ñ">¸|Ó"LÐà&AÑ&[Ð#à&*§n¡nÐ5PÓ&QÐ#Ø&*§l¡lÐ3NÓ&OÐ#à*Ð*øô3 ó 	cÜÐZÓ[ÐabÐbûð	cús   ‚A,D# Ä#
D>Ä-D9Ä9D>)	r-   rr   rp   r1   rm   r   rn   rk   rl   )NN)r\   r]   r^   r_   r#   rL   r`   ra   rb   s   @r:   rd   rd      s   ø† õ>÷*+ò +r<   rd   c                   óD   ^ • \ rS rSrSU 4S jjrSS jr  SS jrSrU =r$ )	ÚLiltSelfAttentioné·   c                 óÊ  >• [         TU ]  5         UR                  UR                  -  S:w  a7  [	        US5      (       d&  [        SUR                   SUR                   S35      eUR                  U l        [        UR                  UR                  -  5      U l        U R                  U R                  -  U l        [        R                  " UR                  U R                  5      U l        [        R                  " UR                  U R                  5      U l        [        R                  " UR                  U R                  5      U l        [        R                  " UR                  UR                  -  U R                  UR                  -  5      U l        [        R                  " UR                  UR                  -  U R                  UR                  -  5      U l        [        R                  " UR                  UR                  -  U R                  UR                  -  5      U l        [        R$                  " UR&                  5      U l        UR                  U l        X l        g )Nr   Úembedding_sizezThe hidden size (z6) is not a multiple of the number of attention heads (Ú))r"   r#   r&   Únum_attention_headsÚhasattrÚ
ValueErrorrR   Úattention_head_sizeÚall_head_sizer   rq   ÚqueryÚkeyÚvaluero   Úlayout_queryÚ
layout_keyÚlayout_valuer/   Úattention_probs_dropout_probr1   Ú	layer_idx)r7   r8   r’   r9   s      €r:   r#   ÚLiltSelfAttention.__init__¸   sâ  ø€ Ü‰ÑÔØ×Ñ × :Ñ :Ñ:¸aÓ?ÌÐPVÐXh×HiÑHiÜØ# F×$6Ñ$6Ð#7ð 8Ø ×4Ñ4Ð5°Qð8óð ð
 $*×#=Ñ#=ˆÔ Ü#& v×'9Ñ'9¸F×<VÑ<VÑ'VÓ#WˆÔ Ø!×5Ñ5¸×8PÑ8PÑPˆÔä—Y’Y˜v×1Ñ1°4×3EÑ3EÓFˆŒ
Ü—9’9˜V×/Ñ/°×1CÑ1CÓDˆŒÜ—Y’Y˜v×1Ñ1°4×3EÑ3EÓFˆŒ
äŸIšIØ×Ñ &×"=Ñ"=Ñ=¸t×?QÑ?QÐU[×UpÑUpÑ?pó
ˆÔô Ÿ)š)Ø×Ñ &×"=Ñ"=Ñ=¸t×?QÑ?QÐU[×UpÑUpÑ?pó
ˆŒô ŸIšIØ×Ñ &×"=Ñ"=Ñ=¸t×?QÑ?QÐU[×UpÑUpÑ?pó
ˆÔô —z’z &×"EÑ"EÓFˆŒà$*×$?Ñ$?ˆÔ!Ø"r<   c                 ó¦   • UR                  5       S S U R                  U R                  U-  4-   nUR                  " U6 nUR	                  SSSS5      $ )Nr    r   ru   r   r   )rD   r†   r‰   ÚviewÚpermute)r7   ÚxÚrÚnew_x_shapes       r:   Útranspose_for_scoresÚ&LiltSelfAttention.transpose_for_scores×   sR   € Ø—f‘f“h˜s m t×'?Ñ'?À×AYÑAYÐ]^ÑA^Ð&_Ñ_ˆØFŠFKÐ ˆØy‰y˜˜A˜q !Ó$Ð$r<   c                 ó¶  • U R                  U R                  U5      U R                  S9nU R                  U R                  U5      U R                  S9nU R                  U R	                  U5      U R                  S9nU R                  U5      nU R                  U R                  U5      5      n	U R                  U R                  U5      5      n
U R                  U5      n[        R                  " X¹R                  SS5      5      n[        R                  " XvR                  SS5      5      nU[        R                  " U R                  5      -  nU[        R                  " U R                  U R                  -  5      -  nXï-   nXþ-   nUb  XÓ-   n[        R                  " SS9" U5      nU R!                  U5      n[        R                  " UU5      nUR#                  SSSS5      R%                  5       nUR'                  5       S S U R(                  U R                  -  4-   nUR*                  " U6 nUb  XÃ-   n[        R                  " SS9" U5      nU R!                  U5      n[        R                  " UU
5      nUR#                  SSSS5      R%                  5       nUR'                  5       S S U R(                  4-   nUR*                  " U6 nUU4nU(       a  UU4-   nU$ )	N)r˜   r    éþÿÿÿrO   r   ru   r   r   )rš   r   ro   r   rŽ   r‹   rŒ   r   r3   ÚmatmulÚ	transposeÚmathÚsqrtr‰   r   ÚSoftmaxr1   r–   Ú
contiguousrD   rŠ   r•   )r7   Úhidden_statesÚlayout_inputsÚattention_maskÚoutput_attentionsÚlayout_value_layerÚlayout_key_layerÚlayout_query_layerÚmixed_query_layerÚ	key_layerÚvalue_layerÚquery_layerÚattention_scoresÚlayout_attention_scoresÚtmp_attention_scoresÚtmp_layout_attention_scoresÚlayout_attention_probsÚlayout_context_layerÚnew_context_layer_shapeÚattention_probsÚcontext_layerÚoutputss                         r:   rL   ÚLiltSelfAttention.forwardÜ   sÆ  € ð "×6Ñ6°t×7HÑ7HÈÓ7WÐ[_×[tÑ[tÐ6ÐuÐØ×4Ñ4°T·_±_À]Ó5SÐW[×WpÑWpÐ4ÐqÐØ!×6Ñ6°t×7HÑ7HÈÓ7WÐ[_×[tÑ[tÐ6ÐuÐà ŸJ™J }Ó5Ðà×-Ñ-¨d¯h©h°}Ó.EÓFˆ	Ø×/Ñ/°·
±
¸=Ó0IÓJˆØ×/Ñ/Ð0AÓBˆä Ÿ<š<¨×5HÑ5HÈÈRÓ5PÓQÐÜ"'§,¢,Ð/A×C]ÑC]Ð^`ÐbdÓCeÓ"fÐà/´$·)²)¸D×<TÑ<TÓ2UÑUÐØ&=ÄÇ	Â	Ø×$Ñ$¨×(AÑ(AÑAóA
ñ '
Ð#ð 0ÑMÐØ"=Ñ"TÐàÑ%à&=Ñ&NÐ#ô "$§¢°Ò!3Ð4KÓ!LÐð "&§¡Ð.DÓ!EÐä$Ÿ|š|Ð,BÐDVÓWÐà3×;Ñ;¸A¸qÀ!ÀQÓG×RÑRÓTÐØ"6×";Ñ";Ó"=¸c¸rÐ"BÀd×FXÑFXÐ\`×\uÑ\uÑFuÐEwÑ"wÐØ3×8Ò8Ð:QÐRÐàÑ%à/Ñ@Ðô Ÿ*š*¨Ò,Ð-=Ó>ˆð Ÿ,™, Ó7ˆäŸš _°kÓBˆà%×-Ñ-¨a°°A°qÓ9×DÑDÓFˆØ"/×"4Ñ"4Ó"6°s¸Ð";¸t×?QÑ?QÐ>SÑ"SÐØ%×*Ò*Ð,CÐDˆà Ð"6Ð7ˆÞØ Ð 2Ñ2ˆGàˆr<   )rŠ   r‰   ro   r1   rŒ   r’   r   rŽ   r   r†   r‹   r   ©N)r   ©NF)	r\   r]   r^   r_   r#   rš   rL   r`   ra   rb   s   @r:   r   r   ·   s!   ø† ÷#ô>%ð Ø÷Aò Ar<   r   c                   óz   ^ • \ rS rSrU 4S jrS\R                  S\R                  S\R                  4S jrSrU =r	$ )ÚLiltSelfOutputi!  c                 ó(  >• [         TU ]  5         [        R                  " UR                  UR                  5      U l        [        R                  " UR                  UR                  S9U l        [        R                  " UR                  5      U l
        g ©Nr   )r"   r#   r   rq   r&   Údenser-   r.   r/   r0   r1   r6   s     €r:   r#   ÚLiltSelfOutput.__init__"  s`   ø€ Ü‰ÑÔÜ—Y’Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
ÜŸš f×&8Ñ&8¸f×>SÑ>SÑTˆŒÜ—z’z &×"<Ñ"<Ó=ˆr<   r¤   Úinput_tensorÚreturnc                 óp   • U R                  U5      nU R                  U5      nU R                  X-   5      nU$ rº   ©rÀ   r1   r-   ©r7   r¤   rÂ   s      r:   rL   ÚLiltSelfOutput.forward(  ó5   € ØŸ
™
 =Ó1ˆØŸ™ ]Ó3ˆØŸ™ }Ñ'CÓDˆØÐr<   ©r-   rÀ   r1   ©
r\   r]   r^   r_   r#   r3   ÚTensorrL   r`   ra   rb   s   @r:   r½   r½   !  ó6   ø† õ>ð U§\¡\ð ÀÇÁð ÐRW×R^ÑR^÷ ò r<   r½   c                   ó´   ^ • \ rS rSrSU 4S jjr  SS\R                  S\R                  S\R                  S-  S\S-  S\	\R                     4
S	 jjr
S
rU =r$ )ÚLiltAttentioni/  Nc                 óÞ   >• [         TU ]  5         [        XS9U l        [	        U5      U l        UR                  nUR                  UR                  -  Ul        [	        U5      U l        X1l        g )N©r’   )	r"   r#   r   r7   r½   Úoutputr&   ro   Úlayout_output)r7   r8   r’   Úori_hidden_sizer9   s       €r:   r#   ÚLiltAttention.__init__0  s]   ø€ Ü‰ÑÔÜ% fÑBˆŒ	Ü$ VÓ,ˆŒà ×,Ñ,ˆØ#×/Ñ/°6×3NÑ3NÑNˆÔÜ+¨FÓ3ˆÔØ,Õr<   r¤   r¥   r¦   r§   rÃ   c                 ó”   • U R                  UUUU5      nU R                  US   U5      nU R                  US   U5      nXg4USS  -   nU$ )Nr   r   ru   )r7   rÑ   rÒ   )	r7   r¤   r¥   r¦   r§   Úself_outputsÚattention_outputÚlayout_attention_outputr¸   s	            r:   rL   ÚLiltAttention.forward:  se   € ð —y‘yØØØØó	
ˆð  Ÿ;™; |°A¡¸ÓFÐØ"&×"4Ñ"4°\À!±_ÀmÓ"TÐØ#Ð=ÀÈQÈRÐ@PÑPˆØˆr<   )rÒ   rÑ   r7   rº   r»   )r\   r]   r^   r_   r#   r3   rË   ÚFloatTensorÚboolÚtuplerL   r`   ra   rb   s   @r:   rÎ   rÎ   /  sj   ø† ÷-ð 48Ø).ñà—|‘|ðð —|‘|ðð ×)Ñ)¨DÑ0ð	ð
   $™;ðð 
ˆu|‰|Ñ	÷ó r<   rÎ   c                   ób   ^ • \ rS rSrU 4S jrS\R                  S\R                  4S jrSrU =r	$ )ÚLiltIntermediateiN  c                 ó  >• [         TU ]  5         [        R                  " UR                  UR
                  5      U l        [        UR                  [        5      (       a  [        UR                     U l        g UR                  U l        g rº   )r"   r#   r   rq   r&   Úintermediate_sizerÀ   Ú
isinstanceÚ
hidden_actÚstrr	   Úintermediate_act_fnr6   s     €r:   r#   ÚLiltIntermediate.__init__O  s`   ø€ Ü‰ÑÔÜ—Y’Y˜v×1Ñ1°6×3KÑ3KÓLˆŒ
Üf×'Ñ'¬×-Ñ-Ü'-¨f×.?Ñ.?Ñ'@ˆDÕ$à'-×'8Ñ'8ˆDÕ$r<   r¤   rÃ   c                 óJ   • U R                  U5      nU R                  U5      nU$ rº   ©rÀ   rä   )r7   r¤   s     r:   rL   ÚLiltIntermediate.forwardW  s&   € ØŸ
™
 =Ó1ˆØ×0Ñ0°Ó?ˆØÐr<   rç   rÊ   rb   s   @r:   rÞ   rÞ   N  s(   ø† õ9ð U§\¡\ð °e·l±l÷ ò r<   rÞ   c                   óz   ^ • \ rS rSrU 4S jrS\R                  S\R                  S\R                  4S jrSrU =r	$ )Ú
LiltOutputi^  c                 ó(  >• [         TU ]  5         [        R                  " UR                  UR
                  5      U l        [        R                  " UR
                  UR                  S9U l        [        R                  " UR                  5      U l        g r¿   )r"   r#   r   rq   rà   r&   rÀ   r-   r.   r/   r0   r1   r6   s     €r:   r#   ÚLiltOutput.__init___  s`   ø€ Ü‰ÑÔÜ—Y’Y˜v×7Ñ7¸×9KÑ9KÓLˆŒ
ÜŸš f×&8Ñ&8¸f×>SÑ>SÑTˆŒÜ—z’z &×"<Ñ"<Ó=ˆr<   r¤   rÂ   rÃ   c                 óp   • U R                  U5      nU R                  U5      nU R                  X-   5      nU$ rº   rÅ   rÆ   s      r:   rL   ÚLiltOutput.forwarde  rÈ   r<   rÉ   rÊ   rb   s   @r:   rê   rê   ^  rÌ   r<   rê   c                   óÀ   ^ • \ rS rSrSU 4S jjr  SS\R                  S\R                  S\R                  S-  S\S-  S\	\R                     4
S	 jjr
S
 rS rSrU =r$ )Ú	LiltLayeril  Nc                 ó®  >• [         TU ]  5         UR                  U l        SU l        [	        XS9U l        [        U5      U l        [        U5      U l	        UR                  nUR                  nUR                  UR                  -  Ul
        UR                  UR                  -  Ul        [        U5      U l        [        U5      U l        X1l
        XAl        g )Nr   rÐ   )r"   r#   Úchunk_size_feed_forwardÚseq_len_dimrÎ   Ú	attentionrÞ   Úintermediaterê   rÑ   r&   rà   ro   Úlayout_intermediaterÒ   )r7   r8   r’   rÓ   Úori_intermediate_sizer9   s        €r:   r#   ÚLiltLayer.__init__m  s¸   ø€ Ü‰ÑÔØ'-×'EÑ'EˆÔ$ØˆÔÜ& vÑCˆŒÜ,¨VÓ4ˆÔÜ  Ó(ˆŒà ×,Ñ,ˆØ &× 8Ñ 8ÐØ#×/Ñ/°6×3NÑ3NÑNˆÔØ#)×#;Ñ#;¸v×?ZÑ?ZÑ#ZˆÔ Ü#3°FÓ#;ˆÔ Ü'¨Ó/ˆÔØ,ÔØ#8Õ r<   r¤   r¥   r¦   r§   rÃ   c                 ó  • U R                  UUUUS9nUS   nUS   nUSS  n[        U R                  U R                  U R                  U5      n	[        U R
                  U R                  U R                  U5      n
Xš4U-   nU$ )N)r§   r   r   ru   )rô   r   Úfeed_forward_chunkrò   ró   Úlayout_feed_forward_chunk)r7   r¤   r¥   r¦   r§   Úself_attention_outputsr×   rØ   r¸   Úlayer_outputÚlayout_layer_outputs              r:   rL   ÚLiltLayer.forward~  s«   € ð "&§¡ØØØØ/ð	 "0ð "
Ðð 2°!Ñ4ÐØ"8¸Ñ";Ðà(¨¨Ð,ˆä0Ø×#Ñ# T×%AÑ%AÀ4×CSÑCSÐUeó
ˆô 8Ø×*Ñ*¨D×,HÑ,HÈ$×JZÑJZÐ\só
Ðð  Ð5¸Ñ?ˆàˆr<   c                 óJ   • U R                  U5      nU R                  X!5      nU$ rº   )rõ   rÑ   ©r7   r×   Úintermediate_outputrý   s       r:   rú   ÚLiltLayer.feed_forward_chunk›  s)   € Ø"×/Ñ/Ð0@ÓAÐØ—{‘{Ð#6ÓIˆØÐr<   c                 óJ   • U R                  U5      nU R                  X!5      nU$ rº   )rö   rÒ   r  s       r:   rû   Ú#LiltLayer.layout_feed_forward_chunk   s+   € Ø"×6Ñ6Ð7GÓHÐØ×)Ñ)Ð*=ÓPˆØÐr<   )rô   rò   rõ   rö   rÒ   rÑ   ró   rº   r»   )r\   r]   r^   r_   r#   r3   rË   rÚ   rÛ   rÜ   rL   rú   rû   r`   ra   rb   s   @r:   rð   rð   l  st   ø† ÷9ð* 48Ø).ñà—|‘|ðð —|‘|ðð ×)Ñ)¨DÑ0ð	ð
   $™;ðð 
ˆu|‰|Ñ	õò:÷
ð r<   rð   c                   óÎ   ^ • \ rS rSrU 4S jr    SS\R                  S\R                  S\R                  S-  S\S-  S\S-  S	\S-  S
\	\R                     \
-  4S jjrSrU =r$ )ÚLiltEncoderi¦  c                 óÈ   >• [         TU ]  5         Xl        [        R                  " [        UR                  5       Vs/ s H  n[        U5      PM     sn5      U l        g s  snf rº   )	r"   r#   r8   r   Ú
ModuleListÚrangeÚnum_hidden_layersrð   Úlayer)r7   r8   Ú_r9   s      €r:   r#   ÚLiltEncoder.__init__§  sG   ø€ Ü‰ÑÔØŒÜ—]’]¼uÀV×E]ÑE]Ô?^Ó#_Ò?^¸!¤I¨fÖ$5Ñ?^Ñ#_Ó`ˆ
ùÒ#_s   ½ANr¤   r¥   r¦   r§   Úoutput_hidden_statesÚreturn_dictrÃ   c                 ó4  • U(       a  SOS nU(       a  SOS n[        U R                  5       H7  u  pšU(       a  Xq4-   nU
" UUUU5      nUS   nUS   nU(       d  M/  X‹S   4-   nM9     U(       a  Xq4-   nU(       d  [        S UUU4 5       5      $ [        UUUS9$ )N© r   r   ru   c              3   ó0   #   • U  H  nUc  M  Uv •  M     g 7frº   r  )Ú.0Úvs     r:   Ú	<genexpr>Ú&LiltEncoder.forward.<locals>.<genexpr>Í  s"   é € ð òAð
 ÷ ‘òùs   ‚	)Úlast_hidden_stater¤   Ú
attentions)Ú	enumerater  rÜ   r   )r7   r¤   r¥   r¦   r§   r  r  Úall_hidden_statesÚall_self_attentionsÚiÚlayer_moduleÚlayer_outputss               r:   rL   ÚLiltEncoder.forward¬  sÒ   € ö #7™B¸DÐÞ$5™b¸4Ðä(¨¯©Ö4‰OˆAÞ#Ø$5Ð8HÑ$HÐ!á(ØØØØ!ó	ˆMð *¨!Ñ,ˆMØ)¨!Ñ,ˆMç Ð Ø&9È1Ñ=MÐ<OÑ&OÒ#ñ  5ö"  Ø 1Ð4DÑ DÐæÜñ ð "Ø%Ø'ñóó ð ô Ø+Ø+Ø*ñ
ð 	
r<   )r8   r  )NFFT)r\   r]   r^   r_   r#   r3   rË   rÚ   rÛ   rÜ   r   rL   r`   ra   rb   s   @r:   r  r  ¦  s’   ø† õað 48Ø).Ø,1Ø#'ñ.
à—|‘|ð.
ð —|‘|ð.
ð ×)Ñ)¨DÑ0ð	.
ð
   $™;ð.
ð # T™kð.
ð ˜D‘[ð.
ð 
ˆu|‰|Ñ	˜Ñ	.÷.
ó .
r<   r  c                   ób   ^ • \ rS rSrU 4S jrS\R                  S\R                  4S jrSrU =r	$ )Ú
LiltPooleriÞ  c                 ó¶   >• [         TU ]  5         [        R                  " UR                  UR                  5      U l        [        R                  " 5       U l        g rº   )r"   r#   r   rq   r&   rÀ   ÚTanhÚ
activationr6   s     €r:   r#   ÚLiltPooler.__init__ß  s9   ø€ Ü‰ÑÔÜ—Y’Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
ÜŸ'š'›)ˆr<   r¤   rÃ   c                 ó\   • US S 2S4   nU R                  U5      nU R                  U5      nU$ ©Nr   )rÀ   r%  )r7   r¤   Úfirst_token_tensorÚpooled_outputs       r:   rL   ÚLiltPooler.forwardä  s6   € ð +ª1¨a¨4Ñ0ÐØŸ
™
Ð#5Ó6ˆØŸ™¨Ó6ˆØÐr<   )r%  rÀ   rÊ   rb   s   @r:   r"  r"  Þ  s(   ø† õ$ð
 U§\¡\ð °e·l±l÷ ò r<   r"  c                   ó@   ^ • \ rS rSr% \\S'   SrSr/ rU 4S jr	Sr
U =r$ )ÚLiltPreTrainedModelií  r8   ÚliltTc                 ó  >• [         TU ]  U5        [        U[        5      (       a\  [        R
                  " UR                  [        R                  " UR                  R                  S   5      R                  S5      5        g g )Nr    r   )r"   Ú_init_weightsrá   r   ÚinitÚcopy_r   r3   r4   Úshaper5   )r7   Úmoduler9   s     €r:   r0  Ú!LiltPreTrainedModel._init_weightsô  s^   ø€ Ü‰Ñ˜fÔ%ÜfÔ0×1Ñ1ÜJŠJv×*Ñ*¬E¯LªL¸×9LÑ9L×9RÑ9RÐSUÑ9VÓ,W×,^Ñ,^Ð_fÓ,gÕhð 2r<   r  )r\   r]   r^   r_   r   Ú__annotations__Úbase_model_prefixÚsupports_gradient_checkpointingÚ_no_split_modulesr0  r`   ra   rb   s   @r:   r-  r-  í  s'   ø‡ àÓØÐØ&*Ð#ØÐ÷ió ir<   r-  c                   óX  ^ • \ rS rSrSU 4S jjrS rS r\         SS\R                  S-  S\R                  S-  S\R                  S-  S	\R                  S-  S
\R                  S-  S\R                  S-  S\
S-  S\
S-  S\
S-  S\\R                     \-  4S jj5       rSrU =r$ )Ú	LiltModeliú  c                 óâ   >• [         TU ]  U5        Xl        [        U5      U l        [        U5      U l        [        U5      U l        U(       a  [        U5      OSU l
        U R                  5         g)z^
add_pooling_layer (bool, *optional*, defaults to `True`):
    Whether to add a pooling layer
N)r"   r#   r8   r   rK   rd   Úlayout_embeddingsr  Úencoderr"  ÚpoolerÚ	post_init)r7   r8   Úadd_pooling_layerr9   s      €r:   r#   ÚLiltModel.__init__ü  sX   ø€ ô
 	‰Ñ˜Ô ØŒä,¨VÓ4ˆŒÜ!5°fÓ!=ˆÔÜ" 6Ó*ˆŒæ,=”j Ô(À4ˆŒð 	‰Õr<   c                 ó.   • U R                   R                  $ rº   ©rK   r(   )r7   s    r:   Úget_input_embeddingsÚLiltModel.get_input_embeddings  s   € Ø‰×.Ñ.Ð.r<   c                 ó$   • XR                   l        g rº   rD  )r7   r   s     r:   Úset_input_embeddingsÚLiltModel.set_input_embeddings  s   € Ø*/‰Õ'r<   NrG   rx   r¦   rH   r   rI   r§   r  r  rÃ   c
           	      ó@  • Ub  UOU R                   R                  nUb  UOU R                   R                  nU	b  U	OU R                   R                  n	Ub  Ub  [	        S5      eUb"  U R                  X5        UR                  5       nO"Ub  UR                  5       SS nO[	        S5      eUu  pÍUb  UR                  OUR                  nUc'  [        R                  " US-   [        R                  US9nUc  [        R                  " XÍ4US9nUcr  [        U R                  S5      (       a3  U R                  R                  SS2SU24   nUR                  XÍ5      nUnO$[        R                  " U[        R                  US9nU R!                  X;5      nU R                  UUUUS	9u  nnU R#                  X%S
9nU R%                  UUUUUU	S9nUS   nU R&                  b  U R'                  U5      OSnU	(       d
  UU4USS -   $ [)        UUUR*                  UR,                  S9$ )a-  
bbox (`torch.LongTensor` of shape `(batch_size, sequence_length, 4)`, *optional*):
    Bounding boxes of each input sequence tokens. Selected in the range `[0,
    config.max_2d_position_embeddings-1]`. Each bounding box should be a normalized version in (x0, y0, x1, y1)
    format, where (x0, y0) corresponds to the position of the upper left corner in the bounding box, and (x1,
    y1) represents the position of the lower right corner. See [Overview](#Overview) for normalization.

Examples:

```python
>>> from transformers import AutoTokenizer, AutoModel
>>> from datasets import load_dataset

>>> tokenizer = AutoTokenizer.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")
>>> model = AutoModel.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")

>>> dataset = load_dataset("nielsr/funsd-layoutlmv3", split="train")
>>> example = dataset[0]
>>> words = example["tokens"]
>>> boxes = example["bboxes"]

>>> encoding = tokenizer(words, boxes=boxes, return_tensors="pt")

>>> outputs = model(**encoding)
>>> last_hidden_states = outputs.last_hidden_state
```NzDYou cannot specify both input_ids and inputs_embeds at the same timer    z5You have to specify either input_ids or inputs_embeds)é   r>   )r@   rH   )rG   r   rH   rI   )rx   r   )r¦   r§   r  r  r   r   )r  Úpooler_outputr¤   r  )r8   r§   r  r  rˆ   Ú%warn_if_padding_and_no_attention_maskrD   r@   r3   rE   rF   Úonesr‡   rK   rH   r5   Úget_extended_attention_maskr=  r>  r?  r   r¤   r  )r7   rG   rx   r¦   rH   r   rI   r§   r  r  ÚkwargsrJ   Ú
batch_sizeÚ
seq_lengthr@   Úbuffered_token_type_idsÚ buffered_token_type_ids_expandedÚextended_attention_maskÚembedding_outputÚlayout_embedding_outputÚencoder_outputsÚsequence_outputr*  s                          r:   rL   ÚLiltModel.forward  sF  € ðP 2CÑ1NÑ-ÐTX×T_ÑT_×TqÑTqÐà$8Ñ$DÑ È$Ï+É+×JjÑJjð 	ð &1Ñ%<‘kÀ$Ç+Á+×BYÑBYˆàÑ  ]Ñ%>ÜÐcÓdÐdØÑ"Ø×6Ñ6°yÔQØ#Ÿ.™.Ó*‰KØÑ&Ø'×,Ñ,Ó.¨s°Ð3‰KäÐTÓUÐUà!,Ñˆ
Ø%.Ñ%:×!Ò!À×@TÑ@Tˆà‰<Ü—;’;˜{¨TÑ1¼¿¹ÈFÑSˆDàÑ!Ü"ŸZšZ¨*Ð)AÈ6ÑRˆNàÑ!Üt—‘Ð(8×9Ñ9Ø*.¯/©/×*HÑ*HÊÈKÈZÈKÈÑ*XÐ'Ø3J×3QÑ3QÐR\Ó3iÐ0Ø!A‘ä!&§¢¨[ÄÇ
Á
ÐSYÑ!Zð 15×0PÑ0PÐQ_Ó0mÐà)-¯©ØØ%Ø)Ø'ð	 *9ð *
Ñ&Ð˜,ð #'×"8Ñ"8¸dÐ"8Ð"^ÐàŸ,™,ØØ#Ø2Ø/Ø!5Ø#ð 'ð 
ˆð *¨!Ñ,ˆØ8<¿¹Ñ8O˜Ÿ™ OÔ4ÐUYˆæØ# ]Ð3°oÀaÀbÐ6IÑIÐIä)Ø-Ø'Ø)×7Ñ7Ø&×1Ñ1ñ	
ð 	
r<   )r8   rK   r>  r=  r?  )T)	NNNNNNNNN)r\   r]   r^   r_   r#   rE  rH  r   r3   rË   rÛ   rÜ   r   rL   r`   ra   rb   s   @r:   r;  r;  ú  s  ø† ÷ò"/ò0ð ð *.Ø$(Ø.2Ø.2Ø,0Ø-1Ø)-Ø,0Ø#'ñh
à—<‘< $Ñ&ðh
ð l‰l˜TÑ!ðh
ð Ÿ™ tÑ+ð	h
ð
 Ÿ™ tÑ+ðh
ð —l‘l TÑ)ðh
ð —|‘| dÑ*ðh
ð   $™;ðh
ð # T™kðh
ð ˜D‘[ðh
ð 
ˆu|‰|Ñ	Ð9Ñ	9ôh
ó öh
r<   r;  zœ
    LiLT Model transformer with a sequence classification/regression head on top (a linear layer on top of the pooled
    output) e.g. for GLUE tasks.
    )Úcustom_introc                   óh  ^ • \ rS rSrU 4S jr\          SS\R                  S-  S\R                  S-  S\R                  S-  S\R                  S-  S\R                  S-  S	\R                  S-  S
\R                  S-  S\
S-  S\
S-  S\
S-  S\\R                     \-  4S jj5       rSrU =r$ )ÚLiltForSequenceClassificationi  c                 ó°   >• [         TU ]  U5        UR                  U l        Xl        [	        USS9U l        [        U5      U l        U R                  5         g ©NF)rA  )	r"   r#   Ú
num_labelsr8   r;  r.  ÚLiltClassificationHeadÚ
classifierr@  r6   s     €r:   r#   Ú&LiltForSequenceClassification.__init__‡  sH   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒØŒä˜f¸Ñ>ˆŒ	Ü0°Ó8ˆŒð 	‰Õr<   NrG   rx   r¦   rH   r   rI   Úlabelsr§   r  r  rÃ   c                 óf  • U
b  U
OU R                   R                  n
U R                  UUUUUUUU	U
S9	nUS   nU R                  U5      nSnUGb©  UR	                  UR
                  5      nU R                   R                  c‘  U R                  S:X  a  SU R                   l        OoU R                  S:”  aN  UR                  [        R                  :X  d  UR                  [        R                  :X  a  SU R                   l        OSU R                   l        U R                   R                  S:X  aI  [        5       nU R                  S:X  a&  U" UR                  5       UR                  5       5      nOŒU" Xç5      nOƒU R                   R                  S:X  a=  [        5       nU" UR                  SU R                  5      UR                  S5      5      nO,U R                   R                  S:X  a  [!        5       nU" Xç5      nU
(       d  U4US	S -   nUb  U4U-   $ U$ [#        UUUR$                  UR&                  S
9$ )a  
bbox (`torch.LongTensor` of shape `(batch_size, sequence_length, 4)`, *optional*):
    Bounding boxes of each input sequence tokens. Selected in the range `[0,
    config.max_2d_position_embeddings-1]`. Each bounding box should be a normalized version in (x0, y0, x1, y1)
    format, where (x0, y0) corresponds to the position of the upper left corner in the bounding box, and (x1,
    y1) represents the position of the lower right corner. See [Overview](#Overview) for normalization.
labels (`torch.LongTensor` of shape `(batch_size,)`, *optional*):
    Labels for computing the sequence classification/regression loss. Indices should be in `[0, ...,
    config.num_labels - 1]`. If `config.num_labels == 1` a regression loss is computed (Mean-Square loss), If
    `config.num_labels > 1` a classification loss is computed (Cross-Entropy).

Examples:

```python
>>> from transformers import AutoTokenizer, AutoModelForSequenceClassification
>>> from datasets import load_dataset

>>> tokenizer = AutoTokenizer.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")
>>> model = AutoModelForSequenceClassification.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")

>>> dataset = load_dataset("nielsr/funsd-layoutlmv3", split="train")
>>> example = dataset[0]
>>> words = example["tokens"]
>>> boxes = example["bboxes"]

>>> encoding = tokenizer(words, boxes=boxes, return_tensors="pt")

>>> outputs = model(**encoding)
>>> predicted_class_idx = outputs.logits.argmax(-1).item()
>>> predicted_class = model.config.id2label[predicted_class_idx]
```N©rx   r¦   rH   r   rI   r§   r  r  r   r   Ú
regressionÚsingle_label_classificationÚmulti_label_classificationr    ru   ©ÚlossÚlogitsr¤   r  )r8   r  r.  rb  rB   r@   Úproblem_typer`  r?   r3   rF   rR   r   Úsqueezer   r•   r   r   r¤   r  ©r7   rG   rx   r¦   rH   r   rI   rd  r§   r  r  rP  r¸   rY  rl  rk  Úloss_fctrÑ   s                     r:   rL   Ú%LiltForSequenceClassification.forward’  sé  € ð\ &1Ñ%<‘kÀ$Ç+Á+×BYÑBYˆà—)‘)ØØØ)Ø)Ø%Ø'Ø/Ø!5Ø#ð ð 

ˆð " !™*ˆØ—‘ Ó1ˆàˆØÒà—Y‘Y˜vŸ}™}Ó-ˆFØ{‰{×'Ñ'Ñ/Ø—?‘? aÓ'Ø/;D—K‘KÕ,Ø—_‘_ qÓ(¨f¯l©l¼e¿j¹jÓ.HÈFÏLÉLÔ\a×\eÑ\eÓLeØ/LD—K‘KÕ,à/KD—K‘KÔ,à{‰{×'Ñ'¨<Ó7Ü"›9Ø—?‘? aÓ'Ù# F§N¡NÓ$4°f·n±nÓ6FÓG‘Dá# FÓ3‘DØ—‘×)Ñ)Ð-JÓJÜ+Ó-Ù §¡¨B°·±Ó @À&Ç+Á+ÈbÃ/ÓR‘Ø—‘×)Ñ)Ð-IÓIÜ,Ó.Ù Ó/æØY ¨¨ Ñ,ˆFØ)-Ñ)9TG˜fÑ$ÐE¸vÐEä'ØØØ!×/Ñ/Ø×)Ñ)ñ	
ð 	
r<   )rb  r8   r.  r`  ©
NNNNNNNNNN)r\   r]   r^   r_   r#   r   r3   Ú
LongTensorrË   rÚ   rÛ   rÜ   r   rL   r`   ra   rb   s   @r:   r]  r]    s  ø† õ	ð ð .2Ø$(Ø37Ø26Ø04Ø26Ø*.Ø)-Ø,0Ø#'ñ_
à×#Ñ# dÑ*ð_
ð l‰l˜TÑ!ð_
ð ×)Ñ)¨DÑ0ð	_
ð
 ×(Ñ(¨4Ñ/ð_
ð ×&Ñ&¨Ñ-ð_
ð ×(Ñ(¨4Ñ/ð_
ð × Ñ  4Ñ'ð_
ð   $™;ð_
ð # T™kð_
ð ˜D‘[ð_
ð 
ˆu|‰|Ñ	Ð7Ñ	7ô_
ó ö_
r<   r]  c                   óh  ^ • \ rS rSrU 4S jr\          SS\R                  S-  S\R                  S-  S\R                  S-  S\R                  S-  S\R                  S-  S	\R                  S-  S
\R                  S-  S\	S-  S\	S-  S\	S-  S\
\R                     \-  4S jj5       rSrU =r$ )ÚLiltForTokenClassificationiõ  c                 ód  >• [         TU ]  U5        UR                  U l        [        USS9U l        UR
                  b  UR
                  OUR                  n[        R                  " U5      U l	        [        R                  " UR                  UR                  5      U l        U R                  5         g r_  )r"   r#   r`  r;  r.  Úclassifier_dropoutr0   r   r/   r1   rq   r&   rb  r@  ©r7   r8   rw  r9   s      €r:   r#   Ú#LiltForTokenClassification.__init__ø  sŠ   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒä˜f¸Ñ>ˆŒ	à)/×)BÑ)BÑ)NˆF×%Ò%ÐTZ×TnÑTnð 	ô —z’zÐ"4Ó5ˆŒÜŸ)š) F×$6Ñ$6¸×8IÑ8IÓJˆŒð 	‰Õr<   NrG   rx   r¦   rH   r   rI   rd  r§   r  r  rÃ   c                 óâ  • U
b  U
OU R                   R                  n
U R                  UUUUUUUU	U
S9	nUS   nU R                  U5      nU R	                  U5      nSnUbW  UR                  UR                  5      n[        5       nU" UR                  SU R                  5      UR                  S5      5      nU
(       d  U4USS -   nUb  U4U-   $ U$ [        UUUR                  UR                  S9$ )a   
bbox (`torch.LongTensor` of shape `(batch_size, sequence_length, 4)`, *optional*):
    Bounding boxes of each input sequence tokens. Selected in the range `[0,
    config.max_2d_position_embeddings-1]`. Each bounding box should be a normalized version in (x0, y0, x1, y1)
    format, where (x0, y0) corresponds to the position of the upper left corner in the bounding box, and (x1,
    y1) represents the position of the lower right corner. See [Overview](#Overview) for normalization.
labels (`torch.LongTensor` of shape `(batch_size, sequence_length)`, *optional*):
    Labels for computing the token classification loss. Indices should be in `[0, ..., config.num_labels - 1]`.

Examples:

```python
>>> from transformers import AutoTokenizer, AutoModelForTokenClassification
>>> from datasets import load_dataset

>>> tokenizer = AutoTokenizer.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")
>>> model = AutoModelForTokenClassification.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")

>>> dataset = load_dataset("nielsr/funsd-layoutlmv3", split="train")
>>> example = dataset[0]
>>> words = example["tokens"]
>>> boxes = example["bboxes"]

>>> encoding = tokenizer(words, boxes=boxes, return_tensors="pt")

>>> outputs = model(**encoding)
>>> predicted_class_indices = outputs.logits.argmax(-1)
```Nrf  r   r    ru   rj  )r8   r  r.  r1   rb  rB   r@   r   r•   r`  r   r¤   r  ro  s                     r:   rL   Ú"LiltForTokenClassification.forward  s	  € ðV &1Ñ%<‘kÀ$Ç+Á+×BYÑBYˆà—)‘)ØØØ)Ø)Ø%Ø'Ø/Ø!5Ø#ð ð 

ˆð " !™*ˆàŸ,™, Ó7ˆØ—‘ Ó1ˆàˆØÑà—Y‘Y˜vŸ}™}Ó-ˆFÜ'Ó)ˆHÙ˜FŸK™K¨¨D¯O©OÓ<¸f¿k¹kÈ"»oÓNˆDæØY ¨¨ Ñ,ˆFØ)-Ñ)9TG˜fÑ$ÐE¸vÐEä$ØØØ!×/Ñ/Ø×)Ñ)ñ	
ð 	
r<   )rb  r1   r.  r`  rr  )r\   r]   r^   r_   r#   r   r3   rs  rÚ   rÛ   rÜ   rË   r   rL   r`   ra   rb   s   @r:   ru  ru  õ  s  ø† õð ð .2Ø(,Ø37Ø26Ø04Ø26Ø*.Ø)-Ø,0Ø#'ñM
à×#Ñ# dÑ*ðM
ð ×Ñ Ñ%ðM
ð ×)Ñ)¨DÑ0ð	M
ð
 ×(Ñ(¨4Ñ/ðM
ð ×&Ñ&¨Ñ-ðM
ð ×(Ñ(¨4Ñ/ðM
ð × Ñ  4Ñ'ðM
ð   $™;ðM
ð # T™kðM
ð ˜D‘[ðM
ð 
ˆu|‰|Ñ	Ð4Ñ	4ôM
ó öM
r<   ru  c                   ó2   ^ • \ rS rSrSrU 4S jrS rSrU =r$ )ra  iX  z-Head for sentence-level classification tasks.c                 ób  >• [         TU ]  5         [        R                  " UR                  UR                  5      U l        UR                  b  UR                  OUR                  n[        R                  " U5      U l	        [        R                  " UR                  UR                  5      U l        g rº   )r"   r#   r   rq   r&   rÀ   rw  r0   r/   r1   r`  Úout_projrx  s      €r:   r#   ÚLiltClassificationHead.__init__[  s   ø€ Ü‰ÑÔÜ—Y’Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
à)/×)BÑ)BÑ)NˆF×%Ò%ÐTZ×TnÑTnð 	ô —z’zÐ"4Ó5ˆŒÜŸ	š	 &×"4Ñ"4°f×6GÑ6GÓHˆr<   c                 óÒ   • US S 2SS S 24   nU R                  U5      nU R                  U5      n[        R                  " U5      nU R                  U5      nU R	                  U5      nU$ r(  )r1   rÀ   r3   Útanhr~  )r7   ÚfeaturesrP  r—   s       r:   rL   ÚLiltClassificationHead.forwardd  sY   € Ø’Q˜š1WÑˆØL‰L˜‹OˆØJ‰Jq‹MˆÜJŠJq‹MˆØL‰L˜‹OˆØM‰M˜!ÓˆØˆr<   )rÀ   r1   r~  )	r\   r]   r^   r_   Ú__doc__r#   rL   r`   ra   rb   s   @r:   ra  ra  X  s   ø† Ù7õI÷ð r<   ra  c                   óˆ  ^ • \ rS rSrU 4S jr\           SS\R                  S-  S\R                  S-  S\R                  S-  S\R                  S-  S\R                  S-  S	\R                  S-  S
\R                  S-  S\R                  S-  S\	S-  S\	S-  S\	S-  S\
\R                     \-  4S jj5       rSrU =r$ )ÚLiltForQuestionAnsweringin  c                 óä   >• [         TU ]  U5        UR                  U l        [        USS9U l        [
        R                  " UR                  UR                  5      U l        U R                  5         g r_  )
r"   r#   r`  r;  r.  r   rq   r&   Ú
qa_outputsr@  r6   s     €r:   r#   Ú!LiltForQuestionAnswering.__init__q  sU   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒä˜f¸Ñ>ˆŒ	ÜŸ)š) F×$6Ñ$6¸×8IÑ8IÓJˆŒð 	‰Õr<   NrG   rx   r¦   rH   r   rI   Ústart_positionsÚend_positionsr§   r  r  rÃ   c                 ó&  • Ub  UOU R                   R                  nU R                  UUUUUUU	U
US9	nUS   nU R                  U5      nUR	                  SSS9u  nnUR                  S5      R                  5       nUR                  S5      R                  5       nSnUb·  Ub´  [        UR                  5       5      S:”  a  UR                  S5      n[        UR                  5       5      S:”  a  UR                  S5      nUR                  S5      nUR                  SU5      nUR                  SU5      n[        US9nU" UU5      nU" UU5      nUU-   S-  nU(       d  UU4USS -   nUb  U4U-   $ U$ [        UUUUR                  UR                  S	9$ )
a*  
bbox (`torch.LongTensor` of shape `(batch_size, sequence_length, 4)`, *optional*):
    Bounding boxes of each input sequence tokens. Selected in the range `[0,
    config.max_2d_position_embeddings-1]`. Each bounding box should be a normalized version in (x0, y0, x1, y1)
    format, where (x0, y0) corresponds to the position of the upper left corner in the bounding box, and (x1,
    y1) represents the position of the lower right corner. See [Overview](#Overview) for normalization.

Examples:

```python
>>> from transformers import AutoTokenizer, AutoModelForQuestionAnswering
>>> from datasets import load_dataset

>>> tokenizer = AutoTokenizer.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")
>>> model = AutoModelForQuestionAnswering.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")

>>> dataset = load_dataset("nielsr/funsd-layoutlmv3", split="train")
>>> example = dataset[0]
>>> words = example["tokens"]
>>> boxes = example["bboxes"]

>>> encoding = tokenizer(words, boxes=boxes, return_tensors="pt")

>>> outputs = model(**encoding)

>>> answer_start_index = outputs.start_logits.argmax()
>>> answer_end_index = outputs.end_logits.argmax()

>>> predict_answer_tokens = encoding.input_ids[0, answer_start_index : answer_end_index + 1]
>>> predicted_answer = tokenizer.decode(predict_answer_tokens)
```Nrf  r   r   r    rO   )Úignore_indexru   )rk  Ústart_logitsÚ
end_logitsr¤   r  )r8   r  r.  rˆ  Úsplitrn  r£   ÚlenrD   Úclampr   r   r¤   r  )r7   rG   rx   r¦   rH   r   rI   rŠ  r‹  r§   r  r  rP  r¸   rY  rl  rŽ  r  Ú
total_lossÚignored_indexrp  Ú
start_lossÚend_lossrÑ   s                           r:   rL   Ú LiltForQuestionAnswering.forward{  sÃ  € ð^ &1Ñ%<‘kÀ$Ç+Á+×BYÑBYˆà—)‘)ØØØ)Ø)Ø%Ø'Ø/Ø!5Ø#ð ð 

ˆð " !™*ˆà—‘ Ó1ˆØ#)§<¡<°°r <Ð#:Ñ ˆjØ#×+Ñ+¨BÓ/×:Ñ:Ó<ˆØ×'Ñ'¨Ó+×6Ñ6Ó8ˆ
àˆ
ØÑ&¨=Ñ+Dä?×'Ñ'Ó)Ó*¨QÓ.Ø"1×"9Ñ"9¸"Ó"=Ü=×%Ñ%Ó'Ó(¨1Ó,Ø -× 5Ñ 5°bÓ 9à(×-Ñ-¨aÓ0ˆMØ-×3Ñ3°A°}ÓEˆOØ)×/Ñ/°°=ÓAˆMä'°]ÑCˆHÙ! ,°Ó@ˆJÙ 
¨MÓ:ˆHØ$ xÑ/°1Ñ4ˆJæØ" JÐ/°'¸!¸"°+Ñ=ˆFØ/9Ñ/EZM FÑ*ÐQÈ6ÐQä+ØØ%Ø!Ø!×/Ñ/Ø×)Ñ)ñ
ð 	
r<   )r.  r`  rˆ  )NNNNNNNNNNN)r\   r]   r^   r_   r#   r   r3   rs  rÚ   rÛ   rÜ   rË   r   rL   r`   ra   rb   s   @r:   r†  r†  n  s6  ø† õð ð .2Ø(,Ø37Ø26Ø04Ø26Ø37Ø15Ø)-Ø,0Ø#'ñ^
à×#Ñ# dÑ*ð^
ð ×Ñ Ñ%ð^
ð ×)Ñ)¨DÑ0ð	^
ð
 ×(Ñ(¨4Ñ/ð^
ð ×&Ñ&¨Ñ-ð^
ð ×(Ñ(¨4Ñ/ð^
ð ×)Ñ)¨DÑ0ð^
ð ×'Ñ'¨$Ñ.ð^
ð   $™;ð^
ð # T™kð^
ð ˜D‘[ð^
ð 
ˆu|‰|Ñ	Ð;Ñ	;ô^
ó ö^
r<   r†  )r†  r]  ru  r;  r-  )3r„  r    r3   r   Útorch.nnr   r   r   Ú r   r1  Úactivationsr	   Úmodeling_layersr
   Úmodeling_outputsr   r   r   r   r   Úmodeling_utilsr   Úpytorch_utilsr   Úutilsr   r   Úconfiguration_liltr   Ú
get_loggerr\   ÚloggerÚModuler   rd   r   r½   rÎ   rÞ   rê   rð   r  r"  r-  r;  r]  ru  ra  r†  Ú__all__r  r<   r:   Ú<module>r¥     s±  ðñ ã ã Ý ß AÑ Aå &Ý !Ý 9÷õ õ .Ý 6ß ,Ý *ð 
×	Ò	˜HÓ	%€ôS=˜Ÿ™ô S=ôl5+˜2Ÿ9™9ô 5+ôpf˜Ÿ	™	ô fôTR—Y‘Yô ôB—I‘Iô ô>r—y‘yô ô —‘ô ô7Ð*ô 7ôt4
"—)‘)ô 4
ôp—‘ô ð ô	i˜/ó 	ió ð	ið ôA
Ð#ó A
ó ðA
ñH ðñôm
Ð$7ó m
óðm
ð` ô^
Ð!4ó ^
ó ð^
ôD˜RŸY™Yô ð, ôk
Ð2ó k
ó ðk
ò\r<   